﻿ovalităţile S conţin numai lg |S| biți de informații, deci există, fără îndoială, algoritmi care vor detecta în cele din urmă redundanța Dar ne interesează cât timp va trece S toate criteriile care contează cu adevărat Aceste idei calitative pot fi exprimate, după cum vom vedea acum, în formă cantitativă O astfel de teorie este destul de subtilă, dar destul de frumoasă și de importantă încât cititorul care își face timp să studieze cu atenție detaliile să fie răsplătit În discuția care urmează, timpul de rulare T(A) al algoritmului A pe N șiruri binare este definit ca numărul maxim așteptat de pași necesari pentru a ieși din A(B), maximul fiind preluat peste toate B € $n, valoarea așteptată numărul fiind media distribuției de aruncare a monedelor Primul pas în analiza cantitativă este acela de a arăta că se poate limita la un criteriu cu totul special Fie Ab un algoritm care depinde doar de primele k cifre binare din șirul de intrare B = Bi B^, unde Luați în considerare algoritmii Fk care încep să arunce N - k monede și înlocuiți Bk + \ ■ ■ B^ cu cifre binare aleatoare B' k + ■■ • B'N până când se execută A Algoritmul Fjv este acelaşi cu A, în timp ce Fq acţionează asupra lui S ca A acţionează asupra $m Fie pk = B(E*,B) Deoarece Y^k=o (Pfc+i ~ Pk) = Pn - Po = B(A, S) - P(A, $n) > e, există k astfel încât pk+i - pk > c/N Fie Ak un algoritm care calculează Fk și prezice valoarea (EDV) + B'k+ + ) mod Cu alte cuvinte, iese Af (B) = (EDV) + Bk+ + B'k+ ) mod ( ) O analiză atentă a probabilităţilor arată că P(Ak', S) - P(Ak, $x) = Pk+i ~ Pk (vezi exerciţiul ) eu Majoritatea //-surselor de S, care au un avantaj practic, sunt surse deplasate simetric, în sensul că fiecare subșir Bi Bk, B Bk+i, ■ , В ѵ а-+і В ѵ daina k are aceeași distribuție de probabilitate Acest lucru este adevărat, de exemplu, când S corespunde unei secvențe liniare congruente, ca în ( ) În astfel de cazuri, lema PI poate fi îmbunătățită luând k = N - Lema R Dacă S este o sursă N cu o deplasare simetrică care eșuează criteriul A cu o toleranță de c, atunci există un algoritm A' cu T( ') P(A,$n), fie A! este AR în demonstrația Lemei PI, aplicat numai la B^-k ■ ■ ■ Bn-iQ O în loc de Bi B^ Atunci A', în medie, se comportă la fel din cauza deplasării simetrice Dacă P(A,S) | + e/N când x este un element aleatoriu din X Timpul de calcul pentru T(G) nu va fi mai mare de T(A) + O(N)(T(f) + T(g)j Dovada Setăm y = q(x) Algoritmul necesar G calculează B = B = f(g(g(x)Y), , B N = f(g[N ^( :)) și aplică algoritmul A! al lemei P Estimă aproximativ /(x) = Bi cu probabilitate > | + e/N, deoarece g este o permutare a lui X, iar Bi B^ este elementul lui S corespunzător valorii inițiale Xo, pentru care g(Xo) = x | Pentru a utiliza Lema P , este necesar să se întărească capacitatea de a estima aproximativ o cifră binară f(x) pentru a putea estima x numai din valoarea g(x) Există doar un mod general subtil de a face acest lucru - folosiți proprietățile funcțiilor booleene dacă extindem S în așa fel încât va fi nevoie de a estima mai multe funcții diferite f(x) aproximativ (Cu toate acestea, metoda este oarecum tehnică Astfel, o primă lectură ar trebui probabil să treacă la Teorema G înainte de a lua în considerare cu atenție următoarele detalii ) Să presupunem că G(zi zr) este o funcție cu valori binare (luând valorile sau ) pe șiruri de biți R care aproximează bine o funcție de forma /(zi zr) = (xiZi + • • • + xrZr) mod pentru niște fix x = xi xr Este convenabil să măsurați cât de reușită este această aproximare prin calcul valoarea medie s= E((- )G( zi zR)+a:iziH \-xrzr ( ) unde media este luată peste toate valorile posibile ale zi zr Aceasta este suma scorurilor corecte minus scorurile incorecte împărțite la L; deci, dacă p este probabilitatea ca G să fie corect, atunci obținem s = p - ( - p) sau p = | + |s De exemplu, să presupunem că R = și G(ziz Z Zi) = [zi / z ][z + z | dacă s = E(( - )G^ ') este pozitiv, unde media este luată peste toate cele z posibile și dacă k este suficient de mare Cheia studiului este afirmația că pentru fiecare fix c = cі Ck rândul d = cB este uniform distribuit: fiecare valoare a lui d apare cu o probabilitate de / J, deoarece cifrele binare din B sunt aleatorii Mai mult, când c' = c\ c'k, rândurile d - cB și d' - c'B sunt independente: fiecare valoare a perechii (d, d') apare cu probabilitate / d Prin urmare, se poate argumenta ca în demonstrarea inegalității lui Cebyșev: pentru orice i fix, suma Ș c^ (- )? (Vezi exercițiul pentru detalii ) Prin urmare, B/(( k - l)s ) este limita superioară a probabilității ca x( ) să nu fie zero la pasul L Teorema G Dacă s \u d E (( - )c ( ) + a "r) > și k > ( R / s ), atunci algoritmul L emite x cu probabilitate > Timpul de calcul este O (k kR) plus timpul de obtinere a notelor kR G I Acum suntem gata să dovedim că secvența metodei pătratice mixte dată în -( ) este o sursă bună de numere (pseudo)aleatoare Să presupunem că d x D/ Alegeți Xo la întâmplare dintre numerele / A\ Atunci putem construi un algoritm F, care va găsi multiplicatorii unui număr întreg aleator de R biți Bloom M = PQ de forma descrisă mai sus cu probabilitate de cel puțin e/( mV) și timp de calcul T(F) = O(N R e~ T(A) + N dv ) Dovada Înmulțirea modulo M se poate face în pași O(R ): deci T(f) + T(g) - O(R ) Prin urmare, lema P afirmă existența unui estimator G cu o estimare reușită a e/N și T(G) ->m)+ :c) > ( -e/N}-(|-e/N)- e /N, unde valoarea medie este preluată peste tot (x, z, m) € X și unde (y, z, rzi) = g(x, z, m) Algoritmul necesar F se obține după cum urmează Dat un număr aleator M = PQ cu P și Q necunoscut Algoritmul calculează un număr aleator A'o între O și A/ și se oprește imediat cu o descompunere cunoscută dacă gcd(Xo, M) În alte cazuri, algoritmul L este utilizat cu G(z) = G(Xq mod M,z,M) și k - [lg(l + X R/e )) Dacă una dintre cele k valori ale lui x la ieșirea sa satisface x = X (modulo M), există o șansă de : ca x ± Xq Atunci mcd(A'o - x, M) și mcd(X + x, M) sunt factori primi ai lui M (vezi "caseta SQRT" a lui Rabin în Secțiunea ) Este clar că timpul de calcul al acestui algoritm este O(N R e~ T(A) + N R e~ ), deoarece e > ~N Probabilitatea ca algoritmul să atingă obiectivul în expansiunea lui M poate fi estimată după cum urmează Fie n = |X|/ Y numărul de opțiuni (x,m) și fie sxm - A J ( -l)G^, 'm'+ a: fie însumarea tuturor numerelor z care conțin R cifre binare Atunci s = "£Lx mSxm/n - e/X Fie t numărul lui (x, m) astfel încât sxm > e/N Probabilitatea ca algoritmul nostru să funcționeze cu perechi similare (x, m) este >e/N]^ P Și în acest caz, conform teoremei G, algoritmul va găsi x cu probabilitate > |, deoarece avem Ce dă teorema P din punct de vedere practic? Dovada noastră arată că constantele incluse în O sunt mici Să presupunem că timpul de calcul pentru factorizare este de cel mult (N e T(L) + Nd e" ) Mulți dintre cei mai renumiți matematicieni ai lumii au lucrat la problema factorizării numerelor mari, în special ani în care s-a demonstrat că factorizarea este strâns legată de criptografie Deoarece nu au putut găsi o soluție bună, avem motive să credem că factorizarea este o chestiune dificilă Prin urmare, teorema P arată că T(A) trebuie să fie mare pentru toți algoritmii care detectează non-aleatoria cifrelor binare obținute prin metoda mixt-quadratică Calculele lungi sunt măsurate în mod convenabil în ani MIP (acesta este numărul de operații efectuate pe an de o mașină care efectuează un milion de operații pe secundă, adică și , x IO ) În , timpul pentru factorizarea unui număr de de cifre zecimale ( de biți) folosind algoritmi foarte avansați a fost de peste de ani MIP Cei mai optimişti cercetători care lucrează la factorizare ar putea fi surprinşi dacă algoritmul constată că numai instrucţiunile exp(R // ( n R) / ) sunt necesare atunci când R -> oo Să presupunem doar că acest număr poate fi atins pentru cel puțin părți nu prea mici ale întregilor Bloom M, constând din R cifre binare Apoi va fi posibil să se înmulțească multe numere formate din aproximativ de cifre binare ( de cifre) în x IO MIP-ani Dacă N = de biți aleatori sunt generați printr-o metodă mixtă-quadratică cu R = și presupunând că toți algoritmii sunt suficient de buni, atunci înmulțirea a cel puțin cu din de biți a numărului Bloom ar trebui să ia cel puțin x MIP- ani Din teorema P rezultă că fiecare astfel de set de de cifre binare trece toate criteriile statistice de aleatorie, al căror timp de calcul T(A) este mai mic de de ani MIP: nu există un algoritm A care să distingă astfel de cifre binare de cele cu adevărat secvențe aleatorii cu probabilitate > c = îqq- Impresionant? Nu Acest rezultat nu este deloc o surpriză, deoarece este necesar să se determine cu exactitate aproximativ de biți cu adevărat aleatori începând exact în metoda pătratică mixtă cu Xo, Z și M când R = Desigur, se pot obține de biți aleatori dintr-un astfel de rezultat contribuţie! Dar, în general, formula m(n) - iCool^ n" exP(n / ( nL) / ) ~NR este valabil în ipotezele noastre moderate când = nqq, termenii NR sunt neglijabili și când R este mare Fie R = și N = IO Apoi, folosind metoda mixed-quadratic, obținem zece miliarde de biți pseudo-aleatori din R și de biți aleatori adevărați care trec toate criteriile statistice care necesită mai puțin de , x IO MIP-ani, ceea ce este egal cu , gigaMIP-ani R = timp calculul necesar pentru a determina părtinirea statistică crește la , teraMIP-ani Un generator pseudo-aleatoriu simplu -( ) care evită masca aleatoare Z poate fi demonstrat, de asemenea, că trece toate testele de aleatorie polinomială dacă factorizarea este dificil de implementat (vezi exercițiul - ) Dar transformările binecunoscute garantează, pentru metodele care sunt ceva mai slabe decât metoda mixt-quadratic, ordinea de creștere este O^N^Re' log( V O€- )) în comparație cu (Nd e- ) din teorema P Toată lumea crede că nu există un algoritm de factorizare pentru numerele formate din R cifre binare, al căror timp de numărare este un polinom la puterea lui R Dacă această ipoteză este strict adevărată, atunci nici măcar nu va fi posibil să se obțină / Rk pentru un întreg Bloom constând din R biți, în timp polinomial pentru orice k fix Teorema P demonstrează că metoda pătratică mixtă generează numere pseudoaleatoare care trec toate criteriile de aleatorie polinomială Cu alte cuvinte, dacă generați biți pătratici mixți aleatori pentru N și R aleși corespunzător, puteți obține și numere care trec toate criteriile statistice rezonabile sau puteți descoperi un nou algoritm de factorizare G Concluzii, istorie și bibliografie Diferitele grade de aleatorie pe care le poate avea o secvență au fost definite mai sus O secvență finită oo-distribuită satisface multe proprietăți utile pe care secvențele aleatoare le pot avea și există o teorie uriașă despre secvențele oo-distribuite (Exercițiile de mai jos dezvoltă unele proprietăți importante ale unor astfel de secvențe care nu sunt menționate în această secțiune ) Definiția lui R este, prin urmare, o bază adecvată pentru studiul teoretic al aleatoriei ' Conceptul de "oo-distribution of a -ary sequence" a fost introdus în de Emile Borel El a introdus, în esență, noțiunea de secvență (m, /^-distribuită și a arătat că reprezentarea în a aproape tuturor numerelor reale este (m, /^-distribuită pentru toate căpușele Borel a numit astfel de numere normale în raport cu baza) b O discuţie excelentă asupra acestui subiect apare în binecunoscutul său Leqons sur la Theorie des Fonctions, ediţia a II-a ( ), - Conceptul unei secvențe oo-distribuite de numere reale, numită și o secvență complet echidistribuită, a apărut pentru prima dată într-o notă a lui N M Korobov (Rapoartele Academiei de Științe a URSS ( ), - ) Korobov și câțiva dintre colegii săi au dezvoltat teoria unor astfel de secvențe destul de amplu într-un număr de lucrări în anii Secvențele complet echidistribuite au fost studiate independent de Joel N Franklin (Math Comp ( ), - ) într-o lucrare care este deosebit de demnă de remarcat deoarece a fost inspirată de problema generării numerelor aleatoare Cartea L Kuipers și H Niederreiter, Uniform Distribution of Sequences (New York: Wiley, ) este o sursă de informații extrem de cuprinzătoare despre vasta literatură matematică care conține secvențe /^-distribuite de toate felurile Cu toate acestea, am văzut că secvențele oo-distribuite nu au suficiente proprietăți pentru a fi considerate complet "aleatoare" Definițiile R -R de mai sus sunt supuse unor condiții suplimentare; în special, definiția lui R pare să fi fost o modalitate adecvată de a defini noțiunea de secvență aleatorie infinită Aceasta este o afirmație cantitativă exactă și este de acord cu noțiunea intuitivă de aleatorie adevărată Din punct de vedere istoric, dezvoltarea acestor definiții a fost stimulată în principal de căutarea de către R von Mises a unei bune definiții a probabilității In matematică Zeitschrift ( ), - , von Mises a propus o definiție similară în spirit cu cea a lui R , deși formularea a fost prea strictă (asemănătoare definiției noastre pentru R ), astfel încât să nu existe secvențe care să satisfacă aceste condiții Mulți cercetători au remarcat această contradicție, iar A G Copeland (Amer J Math ( ), - ) a propus să slăbească definiția lui von Mises printr-o înlocuire, pe care a numit-o numere admisibile (sau secvențe Bernoulli) Există un echivalent de [ ^-secvențe oo-distribuite în care toate intrările Un sunt înlocuite cu dacă Un p pentru o probabilitate dată p Deci, Copeland, în esență, a propus să revină la definiția lui R Apoi Abraham Wald a arătat că nu era nevoie să slăbim definiția lui von Mises atât de drastic și a propus ca setul numărabil să fie înlocuit cu reguli de succesiune Într-un articol important de Ergebnisse eines math Kolloquiums (Viena, ), - , Wald a demonstrat în esență teorema W, deși a concluzionat în mod eronat că șirul construit prin algoritmul W satisface și condițiile puternice Pr([ n € A) = măsura A pentru toate AS măsurabile Lebesgue [ ) Rețineți că nu există nicio secvență care să poată satisface această condiție Conceptul de "computabilitate" a jucat un rol important într-un stadiu incipient, când Wald a scris o lucrare și A Church (A Church, Bull Amer Math Soc ( ), - ) a arătat cum exact conceptul de "algoritm eficient" poate fi atașat teoriei lui Wald, făcând definiția sa perfect riguroasă Aproape în același timp, o completare la definiția lui R a fost propusă de A N Kolmogorov [Sankhyă A ( ), - ], precum și definiția lui Q pentru secvențe finite O altă definiție a aleatoriei pentru secvențele finite, undeva între definițiile lui Q și Q , a fost formulată mult mai devreme de A S Besicovitch (A S Besicovitch, Math Zeitschrift ( ), - ) În publicațiile lui Church și Kolmogorov au fost luate în considerare numai secvențe binare pentru care Pr(Xn = ) = p cu o probabilitate dată p Această secțiune s-a ocupat de o situație mai generală, deoarece [ ^-secvența reprezintă în esență toate p deodată Definiția von Mises-Wald-Church a fost îmbunătățită într-un alt mod interesant de J V Howard (JV Howard, Zeitschr fiir math Logik und Grundlagen der Math ( ), - ) Următoarea contribuție importantă a fost făcută de Donald W Loveland (Donald W Loveland, Zeitschr fiir math Logik und Grundlagen der Math ( ), - ), care a discutat despre definițiile lui R -R și alte câteva concepte Loveland a demonstrat că există secvențe aleatoare RS care nu satisfac definiția lui R În acest sens, el a constatat că este nevoie de o definiție mai riguroasă, cum ar fi R De fapt, Loveland a definit o simplă permutare a numerelor întregi nenegative și un algoritm W' similar cu W, astfel încât W/(n)>l)-Pr(t /(n)>l)>i pentru fiecare secvență aleatorie R- (Un) produsă de algoritmul W' când este dat de un set infinit de reguli de subsecvență TZk Deși definiția lui R este intuitiv mai strictă decât definiția lui R , evident că nu este ușor să dovedești acest lucru riguros Timp de câțiva ani, această întrebare a rămas deschisă, deoarece R include cumva R În cele din urmă, Thomas Herzog și James C Owings, Jr au reușit să construiască o familie mare de secvențe care au satisfăcut R dar nu satisface R [Cm Zeitschr fir de matematică Logik und Grundlagen der Math ( ), - ] Un alt articol important a fost scris de Kolmogorov [Probleme de transmitere a informațiilor ( ), - ] În aceasta el a luat în considerare problema definirii "conținutului informațional" al unei secvențe, iar această lucrare a condus la o definiție interesantă de către Chaitin și Martin-Lof a secvențelor aleatoare finite în termeni de "aleatorie" [Cm IEEE Trans IT- ( ), - ] Ideea lor poate fi urmărită și în lucrările lui R J Solomonoff (RJ Solomonoff, Information and Control ( ), - , - ; IEEE Trans IT- ( ), - ; J Comp System Sci ( ), - ) O discuție filozofică despre secvențele aleatoare poate fi găsită în K R Popper (K R Porreg, The Logic of ScientiSc Discovery (Londra, )); deosebit de interesantă este construcţia de la p - , publicată pentru prima dată în Alte conexiuni între secvențele aleatoare și teoria funcției recursive au fost explorate de DW Loveland, Trans amer Matematică soc ( ), - Vezi și lucrarea lui K -P Schnorr (S -R Schnorr, Zeitschr Wahr verw Geb ( ), - ), care a găsit legături puternice între secvențele aleatoare și "categorii de măsură", care au fost definite de L E Ya Brower ( L E J Brouwer) în În următoarea carte a lui Schnorr, Zufalligkeit und Wahrscheinlichkeit [Note de curs în matematică (Berlin: Springer, )], oferă o imagine de ansamblu detaliată a întregului subiect al aleatoriei și o excelentă introducere în noile publicații pe această temă O privire de ansamblu asupra evoluțiilor majore din următoarele două decenii poate fi găsită în An Introduction to Kolmogorov Complexity and Its Applications (Springer, ), de Ming Li și Paul MB Vitânyi Bazele teoriei secvențelor pseudoaleatoare și ale informațiilor efective au fost puse de Manuel Blum, Silvio Micali și Andrew Yao în [FOCS ( ), - , - ; SICOMP ( ), - ], în care sunt construite primele secvenţe explicite care satisfac toate criteriile statistice posibile Bloom și Micali au introdus noțiunea de nucleu cu cifre binare dure, o funcție booleană /, astfel încât f(x) și g(x) sunt ușor de calculat, deși funcția f(gt~l](x)) nu este Lema P își are originea în articolul lor Leonid Levin a dezvoltat teoria în Combinatorica ( ), - Apoi, el și Oded Goldreich [STOC ( ), - ] au analizat algoritmi precum metoda pătratică mixtă și au demonstrat că prin utilizarea măștii în acest fel, se poate obține un miez dur în multe cazuri În cele din urmă, Levin, în J Symbolic Logic ( ), - , a îmbunătățit metodele lucrărilor anterioare introducând algoritmul L și analizându-l Mulți autori au contribuit la teorie, în special Impagliazzo, Levine, Luby și Hâstad [STOC ( ), - ; ( ), - ], care au arătat că secvențele pseudo-aleatoare pot fi construite din orice funcție cu o singură valoare Cu toate acestea, astfel de rezultate nu sunt luate în considerare aici, deoarece sunt aplicate în principal în teoria abstractă complexă, și nu în generarea practică de numere aleatoare Aplicarea practică a lucrării teoretice la pseudoaleatorie a fost investigată mai întâi empiric de P L'Ecuyer și R Proulx, Proc Simulare de iarnă Conf ( ), - Dacă numerele nu sunt aleatorii, atunci ele sunt cel puțin în dezordine completă - GEORGE MARSAGLIA ( ) EXERCIȚII [ ] Poate fi echidistribuită o succesiune periodică? [ ] Considerăm succesiunea binară periodică , , , , , , , , Este -, - sau -distribuită? [M ] Construiți o succesiune periodică ternară cu distribuții [NMC] Demonstrați că Pr(S(n) uT(n)) + Pr(S(n) sau T(n)) = Pr(S(n)) + Pr(T(n)) pentru oricare două afirmațiile S(n) și T(n), presupunând că există cel puțin trei dintre aceste limite De exemplu, dacă secvența este -distribuită, atunci se poate găsi asta Pr(ui Arătați că Pr(S)(n) este valabil pentru unele j > ) > > Pr(Sy(n)), și dați un exemplu , indicând faptul că egalitatea poate să nu fie valabilă [НМ ] Fie {ЗіДп)} o familie de aserțiuni astfel încât Pr(Si ,(n)) există pentru tot i,j > Să presupunem că pentru tot n > ;;(n) este valabil pentru exact o pereche de numere întregi i,j Dacă j> Pr(Sij(n)) = , atunci rezultă că "Pr(Sij(n) este valabil pentru unele j > )" există pentru tot i > și este egal cu E^Pr^An)) ? [M ] Demonstrează ( ) [HM ] Demonstrați Lema E [Indicație Luați în considerare ^ Ț- (țljn - a) -] ► [HM ] Unde este faptul că m împarte q folosit în demonstrarea teoremei C? [M ( ] Aplicând teorema C, demonstrați că dacă șirul (( n) este oo-distribuit, atunci este o subsecvență a lui (( n) [HM ] Să se arate că o secvență ^-distribuită satisface criteriul maxim-fc în următorul sens: uk ► [HM } Arătați că șirul oo-distribuit [ ^-secvența trece criteriul intervalului în următorul sens: dacă fie /(n) cel mai mic număr întreg m > f(n - ) astfel încât a /(n) este cel mai mic număr întreg m > f(n - ) astfel încât Um-i > Um, atunci Pr(/(n) - /(n - ) = k) = fc/(fc + )! - (fc + l)/(fc + )! ► [NMZO] Arătați că o secvență distribuită oo trece criteriul de colectare a cuponului, în care există doar două feluri de cupoane, în următorul sens: fie Xi, Xi, ■ fie un binar distribuit în oo secvenţă Fie /( ) = și pentru n > fie /(n) cel mai mic număr întreg m > /(n - ) astfel încât {Xdn i)+i, , Xm} este mulțimea { , } Demonstrați că Pr(/(n) - /(n - ) = k) = /c pentru k > (vezi Exercițiul ) [HM ] Criteriul de colectare a cupoanelor pentru secvențele oo-distribuite este valabil atunci când există mai mult de două tipuri de cupoane? (Vezi exercițiul anterior ) [JM ] Pentru orice număr rațional dat r, Franklin a demonstrat că șirul (rn mod ) nu este -distribuit Dar există un număr rațional r pentru care această secvență este echidistribuită? În special, este secvența echidistribuită pentru r = |? [Cm K Mahler, Mathematika ( ), - ] ► [НМ ] Demonstrați că dacă Uo, Ui, este ^-distribuit, atunci la fel este și șirul Vo, Vi, , unde Vn este \nUn\/n [HM ] Luați în considerare modificarea definiției lui R pentru a solicita ca o subsecvență să fie doar -distribuită, nu oo-distribuită Există o secvență care satisface această definiție mai slabă și nu este oo-distribuită? (Această definiție este cu adevărat mai slabă?) ► [НМ ] (N G de Bruijn și P Erdos) Primele n puncte ale oricărei [ ^-secvență (Un) cu Uo = împart ) în n subintervale Fie aceste subintervale să aibă lungimi l'hl> > i'n > > ••• > / n) Este evident că Іn': > ± > Іп), întrucât ІгУ + • • • + nP > = Una dintre modalitățile de măsurare a uniformității distribuției (Un) este luarea în considerare a limitelor L = lim sup nln^ și L = lim inf nl^ P-+OO n-+°° a) Care sunt L și L pentru secvența van der Corput ( )? b) Arătaţi că I^b-i - Pentru I / n c) Demonstraţi că L > ni)?' > /In pentru toate n Prin urmare, it atinge valorile optime ale lui L și L [NSHO] (L G Ramshaw (L N Ramshaw) ) a) Continuăm exercițiul anterior Secvența (U'n) va fi distribuită egal? b) Să se arate că (U'n) este doar o [ ^-secvență pentru care *= In ) orice succesiune de funcții continue pe mulțimi de rânduri de dimensiune n {(/i, ,/n) | Іі > ••• > Ип и h + ■ • ■ + ln = }, satisfacând următoarele două proprietăți: /'nn(m^ '• • • ' ■■■ > rn^n> • • • > =/n^ '■ ■ ■ dacă SM Pentru fn(l'i, • • ,/")• [Exemple: p#'; -pcp); n^ + • • • + / n) ) ] Fie Г = limsup/nGn ^ • • ■, pp)) n -> oo pentru secvența (Zhp) Arătați că fn(ln\ - • ■ ,n) ) > F față de orice alt [ O ^-secvente ► [HMZO] (Hermann Weyl) Arătați că [ ^-secvența este (Un) fc-distribuită dacă și numai dacă Im exp( my(сіС п-I -F CkUn+ki}} = O (b) Prin urmare , ((aana + • • • + aip + ao) mod ) este echidistribuită când d > și aj sunt numere iraționale [HM ] O secvență se numește albă dacă toți coeficienții de corelație în serie sunt zero, adică dacă relația din Corolarul S este valabilă pentru tot k > (Conform Corolarului S, o secvență oo-distribuită este albă ) Arătați că dacă [ ^-secvența este echidistribuită, atunci este albă dacă și numai dacă Um - ~ - |) ~ pentru toate k > k+ ) = (Acest lucru indică o slăbiciune în testul de corelație serială ) [HM ] Care este cea mai mare valoare posibilă pentru Pg(Vn > Vn+i) într-o secvență albă distribuită egal? (D Coppersmith a construit o secvență pentru care această valoare ajunge la | ) ► [HM ] Folosiți șirul ( ) pentru a construi o [ ^-secvență pentru care Pg(Pgn > |) = | [HM ] Fie Xo, Xi, o secvență binară distribuită ( /c) Arata asta ► [M ] Construiți o secvență binară ( &)-distribuită pentru care (Astfel, inegalitatea din exercițiul anterior este cea mai bună ) [MZO] Arătați că există [ ^-secvențe care satisfac definiția lui R , dar vnln> | pentru toate n > , unde ѵn este numărul j n e A) = p, atunci Pr( [Jtn e A) ) = p ► [M ] Definiți regulile de subsecvență T^i, R , R- , ■■■ astfel încât cu aceste reguli se poate folosi algoritmul W pentru a da un algoritm eficient pentru construirea unei definiții satisfăcătoare a [ t-secvență din R ► [HM ] (DW Loyeland) Arătați că dacă o secvență binară (Xn) este RS-aleatorie și dacă (sn) este orice secvență numărabilă conform definiției lui R , atunci Pz(X , n = ) > | și Pr(Xen = ) clnN pentru unele n și u pentru tna ) =MM) ss-=MM- ; /* rotesc binar cifre */ pentru (;j ;j-) x[j+j]=x[j]; /* "квадрат" */ pentru (j=KK+KK- ;j>KK-LL;j-= ) x[KK+KK-lj]=evenize(x[j]); pentru (j=KK+KK- ;j>=KK;j-) if(este impar(x[j])) { x[j-(KK-LL)]=mod diff(x[j-(KK-LL) )],x[j]); x[j-KK]=mod diff (x[j-KK] ,x [j ] ); if (is odd(ss)) { /* "умножаем на z" */ pentru (j=KK;j> ;j ) x[j]=x[jl]; x[ ]=x[KK]; /* сдвигаем буфер циклично */ if (este impar(x[KK])) x[LL]=mod diff(x[LL],x[KK]); dacă (ss) ss>>= ; altfel t-; ■pentru (j= ; j - [ ] Convertiți programele C openargg și ranstart în programe FORTRAN care generează aceeași secvență de numere ► [M ] Să presupunem că aritmetica în virgulă mobilă pe duble se rotunjește corect în sensul Secțiunii (adică exact când valorile sunt mărginite corespunzător) Convertiți programele C open argg și ranstart în programe similare care produc fracții aleatoare cu precizie dublă în [ ) în loc de numere întregi de de biți ► [M ] Ce generator de numere aleatorii ar fi potrivit pentru un minicalculator care are aritmetică numai pentru numere întregi din regiunea [- ]? [M ] Comparați generatorul de scădere cu împrumutul din ex - cu generatorul de întârziere Fibonacci implementat în programele acestei secțiuni [L/ ] (Viitorul versus trecut ) Fie Xn = (Xn- + -Xn-ioo) mod Luați în considerare succesiunea (Yo, Yi, ) = (Xo, Xi, , Xe, Xoo, Xeo, • • •, -Agee, Xo, X , , A , Xeoo, • • ■ ) • (Respunde apelării repetate a programului n-argary(a, ) când numai biții mai puțin semnificativi sunt luați în considerare după ce jumătate dintre elemente sunt aruncate ) Următorul experiment a fost repetat de un milion de ori folosind secvența (Yn): "Generează de biți aleatori, atunci, dacă sau mai mulți dintre ei sunt zero, generați altul și imprimați-l " Ca rezultat, au fost tipărite de zerouri și de uni, dar probabilitatea ca de biți aleatori să conțină cel mult de uni este de aproximativ Dați o explicație matematică pentru ce există atât de multe zerouri în rezultat [ ] Scrieți un program C pentru a genera numere întregi aleatorii generate de programul ap argau, eliminând toate, cu excepția primelor de elemente din fiecare elemente, așa cum se recomandă în secțiune CAPITOLUL ARITMETIC În practica matematică, nu există nimic mai deranjant (studenți corecti, amabili la matematică), care ar enerva și ar interfera cel mai mult cu calculatoarele decât înmulțirea, împărțirea sau extragerea rădăcinilor pătrate și cubice ale numerelor mari Executarea acestor operațiuni nu numai că duce la pierderi semnificative de timp, dar este și asociată cu o astfel de masă de erori ascunse, încât am început să mă gândesc să găsesc un mijloc fiabil și convenabil de a elimina astfel de interferențe - J NAPIER [NEPAIR] ( ) Nu suport plierea! Cea mai mare greșeală este să consideri aritmetica o știință exactă Există legi secrete ale numerelor pe care doar o minte ca a mea le poate înțelege De exemplu, atunci când adăugați numere într-o coloană, mai întâi de jos în sus și apoi invers, veți obține întotdeauna sume diferite - M P LA TOUCHE (M R LA TOUCHE) ( ) Nu-mi pot imagina pe cineva care trebuie să facă sau chiar de înmulțiri pe oră; un remediu atât de radical precum trecerea la sistemul de numere octale nu ar trebui impus întregii omeniri de dragul câtorva indivizi - F X WALES ( ) Majoritatea teoreticienilor numerelor nu manifestă interes pentru aritmetică - B PARLETT (V PARLETT) ( ) Scopul principal al acestui capitol este o analiză amănunțită a celor patru operații de bază ale aritmeticii: adunarea, scăderea, înmulțirea și împărțirea Aritmetica este considerată de mulți o disciplină banală predată copiilor, iar operațiile aritmetice sunt lotul computerelor; dar vom vedea mai târziu că aritmetica este un subiect fascinant cu multe aspecte interesante Este în centrul multor aplicații informatice importante și, prin urmare, este necesar să se studieze cu atenție metodele eficiente de calculare a operațiilor pe numere De fapt, aritmetica este o ramură a științei vie și încă în curs de dezvoltare, care a jucat un rol important în istoria lumii Acest capitol va analiza algoritmi pentru efectuarea de operații pe diferite tipuri de mărimi: numere în virgulă mobilă, numere foarte mari, fracții (numere raționale), polinoame și serii de puteri În plus, vor fi discutate aici subiecte înrudite, cum ar fi conversia dintr-un sistem numeric în altul, factorizarea numerelor în factori și operații pe polinoame SISTEME DE NUMERE POZIȚIONALĂ Modul în care sunt efectuate operațiile aritmetice este strâns legat de modul în care sunt reprezentate numerele pe care se operează Prin urmare, este rezonabil să începem studiul subiectului cu o discuție despre abordările fundamentale ale reprezentării numerelor Reprezentarea pozițională cu baza b (sau baza b) este definită de regulă ( azagaiao a ia )b = • • • + azb + + O\b^ + ao + a i + a r + • • •; ( ) de exemplu, ( )e = - + - + + - = | Sistemul zecimal tradițional este, desigur, un caz special în care b este egal cu zece, iar valorile a* sunt alese dintre "cifrele zecimale" , , , , , , , , , ; în acest caz, indicele b din ( ) poate fi omis Cele mai simple generalizări ale sistemului zecimal se obțin atunci când un număr întreg mai mare decât este luat ca b, iar numerele întregi din intervalul = > ( ) Unde Aj ~ (flkj+k-l•••O kj+lOkj)b (vezi exercițiul ) Astfel, există o modalitate ușoară de a trece "pur vizual" de la, să zicem, binar la hexazecimal În plus față de sistemele standard radix b discutate mai sus, există multe alte variante interesante ale sistemelor de numere poziționale De exemplu, s-ar putea lua în considerare numerele în baza (- ), astfel încât ( a a a ao a a ■ ■ ■ )-io = • • • + az(- ) + ar (- ) + ai (- ) + ao + - = • ■ - IOOOaz + a - ai + ao - -^a i + -p^a - - • • ■ Aici, ca și în sistemul zecimal tradițional, numerele satisfac inegalitățile iaAg - ) A pentru o succesiune infinită de ai, a , az, zerouri și unu Este cunoscut și sub denumirea de "dragon cu două capete" (vezi M F Barnsley, Fractals Everywhere, ediția a doua (Academic Press, ), , ) Pe fig Figura arată că mulțimea S poate fi împărțită în de părți congruente cu S Rețineți că, dacă mulțimea S este rotită în sensul acelor de ceasornic cu °, atunci se împarte în două mulțimi adiacente congruente cu ( /\/ ) S , deoarece ( z - )S = SU ( + ) O dovadă detaliată că mulțimea conține toate numerele complexe suficient de mici ca valoare absolută este luată în considerare în exercițiul Poate cel mai elegant dintre toate sistemele de numere este sistemul de numere ternar echilibrat (bazat pe ), care folosește "trits" (cifre ternare) - , și + în loc de numerele , și Înlocuind - cu simbolul Î, obținem următoarele exemple de numere ternare echilibrate Orez Setul fractal S, numit "dragon cu două capete" Numere ternare echilibrate О О ОО î ОО , Numerele zecimale | - | - O modalitate de a găsi un număr într-un sistem ternar echilibrat este următoarea Mai întâi, scrieți numărul în sistemul numeric ternar, de exemplu , = ( , ) (O modalitate foarte simplă de a converti în ternar, potrivită pentru calcul manual cu creion și hârtie, este descrisă în exercițiul ) Apoi îi adăugăm în ternar numărul infinit , după care obținem pt exemplul de mai sus este un număr infinit ( ) În cele din urmă, scădeți bit cu bit, scăzând fiecare cifră cu una și obțineți , = ( Î Î Î Î ) ( ) Acest proces poate fi făcut destul de riguros prin înlocuirea numărului infinit artificial cu un număr cu un număr adecvat de uni Sistemul numeric ternar echilibrat are multe proprietăți atractive a) Negarea unui număr se realizează prin înlocuirea reciprocă a lui și н b) Semnul unui număr este dat de tritul său cel mai semnificativ diferit de zero; în general, orice două numere pot fi comparate folosind ordinea lexicografică, citind cuvântul de la stânga la dreapta, ca în zecimală c) Operația de rotunjire la cel mai apropiat număr întreg este identică cu trunchierea; cu alte cuvinte, totul din dreapta punctului de separare este pur și simplu aruncat Operația de adăugare într-un sistem ternar echilibrat este destul de simplă dacă utilizați tabelul de adăugare ОIООООIОО ООО ООО ООО Î îl îl î î îl î î î lî semnul subtraendului și adunarea ulterioară Înmulțirea se reduce și la operațiile de inversare și adunare, ca în exemplul următor О I [ ] О О [ ] О eu О О О О [ ] Reprezentarea numerelor într-un sistem ternar echilibrat este implicită într-un puzzle matematic celebru, numit de obicei "problema greutății Bachet", deși a fost formulată de Fibonacci cu patru secole înainte ca Basche să-și scrie cartea, iar persanul Tabari a făcut-o chiar mai devreme - mai mult cu de ani înainte de Fibonacci [Cm W Ahrens, Mathematische Unterhaltungen und Spiele (Leipzig: Teubner, ), Secţiunea ; H Hermelink, Janus ( ), - ] Sistemele de numere poziționale cu cifre negative au fost inventate de J Colson [Philos Trans ( ), - ], apoi uitat și din nou descoperit aproximativ de ani mai târziu de Sir John Leslie [The Philosophy of Arithmetic (Edjnburgh, ); cm c - , , - , , ] şi A Cauchy [Comptes Rendus Acad sci Paris ( ), - ] Cauchy a remarcat că numerele negative evită să fie nevoie să-și amintească tabla înmulțirii după x Afirmația că astfel de sisteme numerice sunt cunoscute de mult în India [J Bharati (J Bharati), Vedic Mathematics (Delhi: Motilal Banarsidass, )], a fost infirmat de K S Shukla (K S Shukla) [Mathematical Education , ( ), - ] În forma sa "pură", sistemul numeric ternar echilibrat a apărut într-un articol al inventatorului dispozitivelor de calcul mecanice Leon Lalanne [Comptes Rendus Acad sci Paris ( ), - ] Sistemul a trecut neobservat până când la de ani de la publicarea lui Lalanne la Institutul Electrotehnic Moore în - , primele calculatoare electronice au început să fie dezvoltate La acea vreme, împreună cu sistemul binar, era considerat serios ca o posibilă alternativă la sistemul zecimal Complexitatea circuitelor electronice ale dispozitivelor aritmetice pentru aritmetica ternară echilibrată nu este cu mult mai mare decât pentru sistemul binar, iar pentru a seta un număr, este nevoie de doar n / n " % din pozițiile digitale ale numărului care este necesar pentru a reprezenta numerele din sistemul binar Discuțiile despre sistemul numeric ternar echilibrat sunt publicate în AMM ( ), - și în High-speed Computing Devices, Engineering Research Associates (McGraw-Hill, ), - Sistemul numeric ternar echilibrat a stat la baza calculatorului experimental sovietic SETUN (vezi SACM ( ), - )* Poate că proprietățile simetrice și aritmetica simplă a acestui sistem numeric vor fi într-o zi foarte semnificative (când "flip flop" este înlocuit cu "flip flop flop")** O altă generalizare importantă a modului pozițional de reprezentare a numerelor este sistemul pozițional de bază mixtă Dacă este dată o secvență de numere (i>n), unde n poate fi negativ, atunci prin definiție se presupune , az, ag, ai, ao; a i, a , ' • • ■, bz, bg, bi, (j; bi, b-h, = • ■ • + ^ ^ i>o + O bii>o + Pibo + oq + a i/b i + a /L-ib + ■ ■ • • ( ) În cele mai simple sisteme de bază mixtă, sunt folosite numai numere întregi; bo, i>i, i> , • ■ ■ se presupune că sunt numere întregi mai mari decât unu și se consideră numai acele numere care nu conțin punct de separare, iar an trebuie să aparțină intervalului -sistem (Ex - ), reprezentare modulară (Secțiunea ), Cod gri (Secțiunea ) și sistem cu cifre romane (Secțiunea ) EXERCIȚII [ ] Exprimați numerele - , - , , , în sistemul numeric de bază - ► [ ] Luați în considerare următoarele patru sisteme de numere: (a) binar (cod direct), (b) nebinar (bază - ), (c) ternar echilibrat și (d) radix b-Utilizați aceste patru sisteme la reprezentări ale fiecăruia dintre cele trei numere: (i) - ; (ii) - | (precizați perioada); (iii) tg (mai multe cifre semnificative) [ ] Exprimă - + i în sistemul cuaternar imaginar [ ] Să presupunem că avem un program MIX, în celula de memorie A există un număr al cărui punct de împărțire este între și octeți, iar în celula de memorie B este un număr al cărui punct de împărțire este între și -m octeți (octetul din stânga este numărul ) Unde va fi localizat punctul de separare din registrele A și X după executarea instrucțiunilor (a) LDA A; MUL B (b) LDA A; SRAX ; DIV B? [ ] Explicați de ce reprezentarea complementului a doi a unui număr întreg negativ este întotdeauna cu o mai mică decât reprezentările complementului a doi atunci când aceste reprezentări sunt tratate ca numere pozitive [ ] Care sunt cele mai mari și mai mici numere întregi pe biți care pot fi reprezentate în binar prin (a) cod direct, (b) cod invers, (c) cod complement a doi? [M ] În textul secțiunii, reprezentarea zecimală a complementului cu zece este definită numai pentru numerele întregi scrise într-un cuvânt mașină Este posibil să se definească în mod similar o reprezentare în același format pentru toate numerele reale care au "precizie infinită"? Există o modalitate similară de a determina reprezentarea zecimală în cod invers pentru toate numerele reale? [MIO] Demonstrați relația ( ) ► [ ] Convertiți următoarele numere octale în hexazecimal folosind cifrele hexazecimale , , , , A, B, C, D, E, F: ; -, -, -, [M ] Generalizați relația ( ) pentru sisteme cu o bază mixtă, ca și în relația ( ) [ ] Elaborați un algoritm pentru calcularea sumei numerelor (an • • • aiao)- și (bn ■ ■ bіbo)- , dând rezultatul sub forma (cn+ • • • cіco)- , folosind sistemul numeric de bază- [ ] Elaborați un algoritm pentru conversia (a) unui număr scris în cod binar direct ±(an ao)r într-o reprezentare nebinară (bn-u ■ • • bo)- și (b) o reprezentare nebinară (b "+i ■ ■ bo)- în cod binar direct ±(an+i ao)r- ► [M ] Există numere care au două expansiuni diferite într-o fracție zecimală infinită, de exemplu , = , Există o reprezentare unică a numerelor într-un număr non-zecimal (de bază - ) sistem, sau există și numere reale conform acestei baze cu două expansiuni infinite diferite? y] Înmulțiți ( ) i cu el însuși în patru folosind metoda descrisă mai sus [M J] Ce înseamnă mulțimile S = { akb~k | a* cifră admisibilă}, similar cu setul prezentat în fig , în sisteme numerice cuaternare imaginare ȘI non-cadecimale? [M ] Scrieți un algoritm pentru adunarea cu (an • • aiao)i-i în baza i - [MZO] Poate părea ciudat că numărul i - este luat ca bază în sistemul numeric, și nu numărul analog, ci mai simplu i + Admite orice număr complex a + y o reprezentare "binară" în sistemul pozițional conform bazei r+ ? [НМ ] Arătați că mulțimea S prezentată în Fig , există un set închis care conține o vecinătate a originii (În consecință, orice număr complex admite o reprezentare "binară" în baza r - ) ► [ ] (David W Matula) Fie D mulțimea numerelor întregi din sistemul cu baza b pentru care ecuația x = j (modulo b) are exact o soluție pentru [Indicație Construiți un algoritm care generează o reprezentare adecvată ] [LM ] (David W Matula ) Să considerăm un sistem numeric zecimal care folosește numerele D = {− , , , , , , în loc de { , , , } , , , } Din rezultat ex rezultă (precum și din exercițiul ) că toate numerele reale pot fi reprezentate prin fracții zecimale infinite folosind cifre din mulțimea D În ex a remarcat că unele numere din sistemul zecimal obișnuit au două reprezentări, (a) Găsiți un număr real care are mai mult de două D - reprezentări zecimale (b) Arătați că niciun număr real nu poate avea o mulțime infinită de D - reprezentări zecimale, (c) Arătați că două sau mai multe D (reprezentări zecimale) au infinit de cifre ► [M ] (K E Shannon (S E Shannon) ) Poate fi reprezentat un număr real arbitrar (pozitiv, negativ sau zero) într-un sistem "zecimal echilibrat", adică sub forma Ș k -"* Demonstrați că pentru un dat e > și orice număr real x există o reprezentare "zecimală" a acestui număr astfel încât O și b > ■ • • > et > , t > Scopul acestui exercițiu este de a generaliza oarecum această proprietate a) Fie șirul numerelor întregi bo, bi, b , astfel încât orice întreg n admite o reprezentare unică sub forma = lei + bc + • • • + le( , > > ■ ■ • > Ci > , t > (Această secvență (bn) se numește bază binară ) Arătați că există o valoare a indicelui j astfel încât bj este impar și pentru toate k j numerele bj sunt pare b) Demonstrați că baza binară (bn) poate fi întotdeauna transformată într-o succesiune de forma do, di, di, = ( ndn), unde fiecare dintre numerele dj este impar c) Demonstrați că, dacă fiecare dintre numerele do, di, di, din elementul (b) este egal cu ± , atunci șirul (bn) formează o bază binară dacă și numai dacă există infinit de multe dj egale cu + , și există infinit de mulți dj egali cu - d) Demonstrați că șirul , - - , • , - • , , • k, - • fc+I, este o bază binară și găsiți reprezentarea lui numărul n = ► [M ] O generalizare a reprezentării numerelor în cod binar invers, cunoscută sub numele de "numere -adice", a fost propusă de K Hensel, Crelle ( ), - (De fapt, K Hansel a propus numere p-adice pentru orice număr prim p ) Un număr -adic poate fi considerat un număr binar U = ( U W W W WI Un)i, a cărui reprezentare se extinde la nesfârşit la stânga şi doar un număr finit de caractere la dreapta punctului de separare Adunarea, scăderea și înmulțirea numerelor -adice sunt efectuate în conformitate cu algoritmul operațiilor aritmetice obișnuite, care, în principiu, permit posibilitatea unei continuări nelimitate spre stânga De exemplu, = ( ) - = ( ) I = ( , ) Y= = ( ) I = ( ) -| = ( ) i = ( , ) SAU ( ) Aici numărul este numărul obișnuit "șapte" în reprezentare binară, iar - este codul invers, extins la nesfârșit la stânga Este ușor de verificat că procedura obișnuită de adunare a numerelor binare dă - + = ( ) = dacă se continuă la nesfârșit Valori | și - | sunt singurele numere -adice care, după ce au fost înmulțite formal cu , dau și respectiv - Valorile jn sunt exemple de numere cu adice care nu sunt "numere întregi" cu adice, deoarece au biți diferit de zero la dreapta punctului de împărțire Cele două valori date ale lui V- , care rezultă una din cealaltă ca urmare a inversării semnului, sunt singurele numere -adice care, după pătratul formal, dau ( ) a) Demonstrați că orice număr -adic u poate fi împărțit la un număr arbitrar -adic ѵ pentru a calcula un număr -adic w care satisface egalitatea u = vw (Deci, setul de numere -adice formează un câmp; vezi secțiunea ) b) Demonstrați că reprezentarea -adică a unui număr rațional, /( n + ), unde n este un număr întreg pozitiv, se poate obține după cum urmează În primul rând, găsim expansiunea binară obișnuită a numărului + /( n + ), care are forma unei fracții periodice ( aaa • • • )r (a este un șir de zerouri și unu) Atunci ( ) va fi reprezentarea -adica a lui - /( n + ) c) Demonstrați că reprezentarea -adică a numărului u este periodică (adică vl'+a = u v pentru tot N mare pentru unele A > ) dacă și numai dacă u este rațional (adică u = t/n pentru unele numere întregi) d) Demonstrați că dacă n este un număr întreg, atunci y/n este un număr -adic numai dacă, pentru un număr întreg nenegativ n, îndeplinește condiția nmod lî+ = fc (Deci fie nmod = , fie n mod = etc ) [MJ ] (I Ruzsa) Formați un număr infinit de numere întregi a căror reprezentare ternară folosește doar și și a căror reprezentare cuaternară folosește doar , și [MJO] (D A Klarner (D A Klarner) ) Fie D o mulțime arbitrară de numere întregi, b orice număr întreg pozitiv și kn numărul de numere întregi distincte care pot fi scrise ca numere de n -biți (an-i ■ • aіvo)b în baza b cu cifre a; în D Demonstrați că șirul (kn) satisface o relație de recurență liniară și explicați cum se calculează funcția generatoare Ilustrați algoritmul dezvoltat arătând că în cazul în care b = și D = {- , , }, numărul kn este numărul Fibonacci ► [ ] (GW Reitwiesner, ) Explicați cum să reprezentați un număr întreg dat n ca ( ) , unde fiecare dintre aj este - , sau , folosind cea mai mică cifră diferită de zero Aritmetică în virgulă flotantă ACEASTA SECȚIUNE discută principiile de bază ale efectuării operațiilor aritmetice asupra numerelor în virgulă mobilă și analizează mecanismul intern al unor astfel de calcule Probabil, acest subiect nu va stârni prea mult interes pentru mulți cititori, fie pentru că calculatoarele pe care lucrează au încorporate instrucțiuni pentru operații pe numere în virgulă mobilă, fie pentru că rutinele necesare sunt conținute în sistemul de operare Dar nu trebuie presupus că materialul din această secțiune se referă exclusiv la competența inginerilor - proiectanți de calculatoare sau un cerc restrâns de oameni care scriu subrutine de sistem pentru mașini noi Fiecare programator competent ar trebui să aibă o idee despre ce se întâmplă atunci când efectuează pașii elementari ai operațiilor aritmetice pe numere în virgulă mobilă Acest subiect nu este deloc atât de banal pe cât se crede în mod obișnuit; este o cantitate surprinzătoare de lucruri în el Calcule de precizie unică A Notarea numerelor în virgulă mobilă În Secțiunea , au fost discutate diferite moduri de notare a numerelor în virgulă fixă Cu această notație, programatorul știe unde ar trebui să fie punctul de separare în numerele cu care sunt efectuate anumite operații În unele situații, la executarea unui program, este mult mai convenabil să se schimbe dinamic poziția punctului de împărțire, cu alte cuvinte, să se facă punctul "plutitor" și să se asocieze informații despre poziția sa cu fiecare număr Această idee a fost folosită mult timp în calculele științifice, în special pentru reprezentarea numerelor foarte mari, cum ar fi numărul lui Avogadro N = , x IO sau numere foarte mici, precum constanta lui Planck h = , x IO- erg-s În această secțiune, ne vom concentra asupra numerelor în virgulă mobilă pe p biți în baza b cu un exces de q Un astfel de număr este reprezentat de o pereche de valori \u b\u b(e, Y), care corespunde valorii (e,/)=/xT' ( ) Aici e este un număr întreg care variază în intervalul corespunzător de valori, iar f este un număr fracționar cu semn Să fim de acord că / J Partea fracționată este egală cu ± / / / /, iar ordinea u e este în intervalul ev, formăm rezultatul după principiul ew = eu, fw = fu + fvlbe*~ev (astfel, poziția punctelor de separare și, în consecință, poziția cifrelor termenilor sunt aliniate) , iar apoi normalizăm rezultatul Pot apărea mai multe situații care fac acest proces netrivial; o descriere mai precisă a metodei este dată în următorul algoritm Algoritmul A (adunare în virgulă mobilă) Pentru numerele în virgulă mobilă normalizate cu p cifre date u = (eu,/u) și ѵ = (ev, fv), suma u = și f r este construită în baza b cu excesul de q Acest algoritm (Fig ) poate poate fi folosit și pentru a scădea numere în virgulă mobilă, dacă ѵ este înlocuit cu -ѵ Al [Despachetați ] Extrageți exponentul și partea fracțională din reprezentările pentru și și ѵ A [Asigurați-vă că eu > ei ] Dacă eu p + (diferență mare de ordine), setați fw ■(- fu și mergeți la pasul A (Deoarece se presupune că u este normalizat, algoritmul ar putea rula și termina, dar este adesea util să folosiți adaosul zero pentru a vă asigura că orice număr, eventual nenormalizat, este normalizat ) A [Scalare prin deplasarea la dreapta ] Deplasați /v la dreapta cu pozițiile ei - еѵ, adică împărțiți fv la le" еѵ [Cometariu Deplasarea poate fi de până la p + cifre, astfel încât următorul pas (adăugarea părții fracționale din /c cu /v) va necesita un acumulator capabil să stocheze p + cifre în baza b la dreapta punctului pozițional Dacă nu este disponibil un astfel de acumulator încăpător, deplasarea poate fi redusă la p + sau p + biți, dar cu precauții adecvate; detaliile sunt discutate în ex ] A [Adăugați] Setați fw fu + fw A [Normalizează ] (În acest moment, (ew,/w) reprezintă suma u și v, dar |/w| poate conține mai mult de p cifre și poate fi mai mare decât una sau mai mică decât /b ) Execută N algoritm descris mai jos, care normalizează și va rotunji (£w, fw), precum și formează rezultatul final | Algoritmul N (Normalizare) "Ordinul brut" e și "partea fracțională brută" f sunt reduse la forma normalizată} cu rotunjire, dacă este necesar, la p cifre Acest algoritm (Fig ) presupune că |/| (depășire fracțională), treceți la pasul N Dacă f este , setați e la cea mai mică valoare și treceți la pasul N N [/ normalizat?] Dacă |/| > /b, treceți la pasul N N [Scalare prin deplasarea la stânga ] Deplasați f cu o cifră la stânga (adică, înmulțiți cu b) și micșorați e cu Reveniți la pasul N N [Scalați prin deplasarea la dreapta ] Deplasați f la dreapta cu un loc (adică împărțiți cu b) și creșteți e cu N [Rotunj ] Rotunzi / la p locuri; (Aceasta înseamnă că f se schimbă la cel mai apropiat multiplu al lui b~p Este posibil ca (bpf) mod = adică să existe doi multipli cei mai apropiați Dacă b este par, atunci înlocuim f cu cel mai apropiat multiplu al lui b~p astfel acel bp/ ' + impar (indicând rezultatul rotunjirii în acest caz ca /') • Pentru o discuție mai detaliată a aspectelor de rotunjire, vezi Secțiunea ) Este important de reținut că operația de rotunjire poate duce la egalitate |/| = (debordare la rotunjire); într-o astfel de situație, ar trebui să reveniți la pasul N N [Verificați e ] Dacă ordinea lui e este prea mare, adică mai mare decât limita permisă, aceasta este considerată o condiție de depășire a comenzii Dacă e este prea mic, este perceput ca îndeplinirea condiției de dispariție Debordare la rotunjire Ordin (Mai multe informații despre acest subiect sunt oferite mai jos; aceste situații sunt de obicei interpretate ca un semnal de eroare, în sensul că rezultatul nu poate fi reprezentat ca un număr normalizat în virgulă mobilă din intervalul de valori cerut ) N [Pachet ] Combinați exponentul lui e și partea fracțională a lui f pentru a obține rezultatul dorit | Câteva exemple simple de adăugare în virgulă mobilă sunt discutate în exercițiul Următoarele subprograme pentru adunarea și scăderea numerelor de forma ( ) pe un calculator MIX sunt un exemplu de implementare software a algoritmilor A și N Aceste subprograme extrag o valoare de intrare și la adresa simbolică ACC se extrage o altă valoare de intrare v din registrul A la intrarea în subrutină Rezultatul lui w apare simultan în câmpul registrului Ive ACC Deci secvența de comenzi LDA A; ADAUGĂ B; SUB C; STA D, ( ) lucrul cu numere în virgulă fixă ar corespunde următoarei secvențe de comenzi care lucrează cu numere în virgulă mobilă: LDA A, STA ACC; LDA B, JMP FADD; LDA C, JMP FSUB; STA D ( ) Programul A (Adunare, Scădere și Normalizare) Următorul program este o subrutină care implementează algoritmul A și este construit în așa fel încât fragmentul de normalizare să poată fi folosit de alții subprograme, care vor fi discutate mai jos În acest program, ca și în multe alte programe din acest capitol, identificatorul OFLO denumește o subrutină care tipărește un mesaj că indicatorul de depășire al mașinii MIX s-a aprins brusc Mărimea octetului b se presupune a fi un multiplu de Rutina de normalizare NORM presupune că rI = e și rAX = /, unde rA = implică rX = și rI eu- STX FU( : ) FU |b? STA TEMP |reziduală| = rotunjire în sus la impar LDX TEMP( : ) JXO N Treceți la pasul N dacă rX este impar H STA *+ ( : ) Păstrați semnul r A INCA BYTE Adăugați b~ la |/| (semnul se poate schimba) JOV N Verificați preaplinul din cauza rotunjirii N J N EXPUN N Test e Dispariția ordinii dacă e b EXPOV HLT Comandă depășită a fost detectată EXPUN HLT Dispariția comenzii a fost detectată ACC CON Acumulator cu virgulă flotantă Un fragment de cod destul de mare (liniile - ) este inclus în program deoarece MIX are un acumulator de octeți pentru adăugarea semnată, în timp ce algoritmul A necesită în general p + = biți pentru acesta De fapt, întregul program poate fi tăiat la jumătate, sacrificând chiar și o cantitate mică de precizie Cu toate acestea, așa cum va fi arătat în secțiunea următoare, este întotdeauna mai bine să obțineți cea mai bună precizie posibilă Linia folosește comanda non-standard MIX descrisă în Secțiunea Timpul de execuție al adunării și scăderii în virgulă mobilă depinde de mai mulți factori, care sunt analizați mai jos în Secțiunea Luați în considerare acum operațiile de înmulțire și împărțire, care sunt mai simple decât adunarea și sunt destul de asemănătoare între ele Algoritmul M {Înmulțirea sau împărțirea numerelor în virgulă mobilă) Având în vedere numerele în virgulă mobilă normalizate pe p-biți u = (eu,/u) și ѵ = {еѵ, fv), produsul w = u(r) ѵ sau câtul w = u ѵ este construit în baza b cu exces de q M [Despachetați ] Extrageți exponenți și părți fracționale în reprezentări și și ѵ (Uneori este convenabil, deși nu este necesar, să verificați dacă operanzii sunt diferiti de zero ca parte a acestui pas ) M [Efectuați operațiunea ] Instalați ew - ei + ev - q, fw - fu fv pentru înmulțire; ew - eu - ev + q + , fw - (b fu) / fv pentru împărțire (Deoarece se presupune că numerele de intrare sunt normalizate, rezultatul va fi fie fw = , fie /b FADD= = H JMP * | Acest program nu este echivalent cu instrucțiunea FLOT deoarece presupune că : octet al registrului rA este zero; în plus, corupă conținutul registrului rX În situații mai generale, trebuie să recurgeți la tot felul de trucuri, deoarece debordarea rotunjirii poate apărea chiar și în timpul execuției instrucțiunii FLOT În mod similar, să presupunem că MIX are o comandă FADD, dar nu FIX Pentru a rotunji numărul s scris în format virgulă mobilă la cel mai apropiat număr întreg cu virgulă fixă (și se știe că numărul este nenegativ și nu va lua mai mult de trei octeți), în program puteți scrie FAD FUDGE, unde celula FUDGE conține o constantă + Q+ i + Q+ Rotunjit(e) rezultatul în gA va arăta ca ( ) D Istorie și bibliografie Originile aritmeticii în virgulă mobilă Urmează până la babilonieni (circa î Hr sau mai devreme), care au folosit aritmetica în virgulă mobilă în baza , dar nu aveau notații pentru ordine Ordinea corectă a fost întotdeauna "implicitată" într-un fel de cei care au efectuat calculele În cel puțin un caz, babilonienii au primit răspunsul greșit, deoarece adăugarea a fost efectuată cu operanzii aliniați incorect, dar acest lucru a fost foarte rar (vezi O Neugebauer, The Exact Sciences in Antiquity (Princeton, NJ: Princeton University Press) ) , ), - ) Un alt exemplu de utilizare timpurie a formatului în virgulă mobilă este asociat cu numele matematicianului grec Apollonius (secolul al III-lea î Hr ), care, aparent, a fost primul care a explicat modul în care înmulțirea poate fi simplificată, cel puțin în cazuri simple, culegând puteri de separat de coeficienții acestora Metoda lui Apollonius este discutată în Colecția de matematică a lui Pappus din Alexandria (secolul al IV-lea d Hr ) După moartea civilizației babiloniene, reprezentarea în virgulă mobilă a fost folosită într-un mod semnificativ pentru a forma produse și fracții abia secole mai târziu, când s-au descoperit logaritmii ( ) și la scurt timp după aceea Oughtred a inventat regula de calcul ( ) Cam în aceeași perioadă, a fost introdusă denumirea modernă "xn" pentru comenzi; au mai fost folosite simboluri separate pentru x-pătrat, x-cub etc Aritmetica în virgulă mobilă a fost încorporată în proiectarea unora dintre cele mai vechi mașini de calcul A fost propus independent de Leonardo Torres y Quevedo la Madrid ( ), Konrad Zuse la Berlin ( ) și George Stibitz în New Jersey ( ) G ) Mașina lui Zuse a folosit o reprezentare binară în virgulă mobilă, pe care el a numit-o notație semilogaritmică; a implementat și o convenție privind operațiunile cu unele valori speciale precum "oo" și "nedefinit" Primul computer american cu virgulă mobilă a fost Model V (Beli Laboratories), urmat de Harvard Mark II Ambele mașini, proiectate în , erau dispozitive de calcul releu [Cm B Randell, The Origins of Digital Computers (Berlin: Springer, ), , , - , - ; Proc Symp Large-Scale Digital Calculating Machinery (Harvard, ), - , - ; Datamation (aprilie, ), - (mai, ), - ; Zeit fiir angew Matematică und Physik ( ), - ] Utilizarea numerelor binare în virgulă mobilă a fost serios discutată în - de către un grup de cercetători de la Școala Moore (Școala Moore) în legătură cu planurile de a crea primul computer electronic, dar s-a dovedit că circuitele electronice care implementează aritmetica în virgulă mobilă sunt mult mai greu de implementat pe lampi decat pe un releu Proiectanții primelor mașini electronice și-au dat seama că scalarea era o problemă întreagă în programare, dar au simțit că era doar o mică parte din activitatea de programare generală din acei ani Desigur, scalarea explicită a numerelor în virgulă fixă părea că merită timpul și efortul, deoarece programatorul trebuia să țină calculele la vedere și să aibă grijă de acuratețea lor în orice moment Designerii au mai susținut că reprezentarea numerelor în virgulă mobilă ocupă spațiu de memorie valoros, deoarece exponenții trebuie stocați În plus, circuitele aritmetice în virgulă mobilă sunt dificil de adaptat la calcule de precizie multiple [Cm von Neumann's CoIIected Works (New York: Macmillan, ), , - ] Desigur, în acest moment construiau o mașină care era prima mașină de program stocată și a doua mașină electronică și au trebuit să aleagă formatul fie fix, fie în virgulă mobilă, dar nu ambele Ei au anticipat programarea aritmeticii binare în virgulă mobilă, iar instrucțiunile "schift left" și "shift right" au fost de fapt introduse în aceste mașini, în principal pentru a le crește eficiența Prima mașină care a avut mijloacele de a efectua operații aritmetice cu ambele formate a fost, se pare, un computer dezvoltat de General Electric [vezi Proc al -lea Simp Large-Scale Digital Calculating Machinery (Cambridge, Mass : Harvard University Press, ), - ] Rutinele în virgulă mobilă care interpretează sistemele pentru calculatoarele timpurii au fost scrise de DJ Wheeler și alții și publicate pentru prima dată în Wilkes, Wheeler, Gill, The Preparation of Programs for an Electronic Digital Computer (Reading, Mass : Addison-Wesley, ) (vezi Al-Toate rutinele) Este interesant de observat că descrie programe pentru reprezentarea zecimală în virgulă mobilă, deși a fost folosit un computer binar; cu alte cuvinte, numerele erau reprezentate ca e/, nu e/, și astfel operațiile de schimbare necesitau înmulțiri sau împărțiri cu La această mașină, scalarea zecimală era aproape la fel de ușoară ca deplasarea, iar reprezentarea zecimală simplifica mult I/O Autorii majorității publicațiilor, atunci când descriu detaliile implementării rutinelor aritmetice, se referă la rapoartele tehnice ale numeroși producători de computere, dar uneori există link-uri către surse deschise Pe lângă lucrările menționate mai sus, prezintă un oarecare interes istoric următoarele: R H Stark și D B MacMilIan, Math Comp ( ), - , care descrie programul, "cusut" pe un panou special detașabil; D McCracken, Digital Computer Programming (New York: Wiley, ), - ; JW Carr III, CACM , (mai, ), - ; W G Wadey, JACM G ( ), - ; DE Knuth, JACM ( ), - ; O Kesner, CACM ( ), - ; F P Brooks și K E Iverson, Procesarea automată a datelor (New York: Wiley, ), - Pentru o discuție despre aritmetica în virgulă mobilă din punctul de vedere al unui designer de computer, a se vedea SG Campbell, "Floating point operation" în Planning a Computer System, editat de W Buchholz (New York: McGraw-Hill, ), - , A Padegs, IBM Systems J ( ), - O listă suplimentară de surse, legate în principal de analiza acurateței calculelor în format virgulă mobilă, este prezentată în secțiunea O schimbare cu adevărat revoluționară în implementarea hardware a aritmeticii în virgulă mobilă a avut loc atunci când majoritatea producătorilor de computere au adoptat standardul ANSI/IEEE la sfârșitul anilor (Vezi IEEE Micro ( ), - ; WJ Cody, Comp Sci and Statistica: Symp on the Interface ( ), - ; W M Kahan, Mini/Micro West- Conf Record ( ), Lucrarea / ; D Goldberg, Computing Surveys ( ), - , ; WJ Cody și JT Coonen, ACM Trans Matematică Software ( ), - ) /țț\ Calculatorul MMIX, care va înlocui MIX-ul în următoarea ediție a acestei cărți, L- va respecta pe deplin acest standard EXERCIȚII [ ] Cum ar arăta numărul lui Avogadro și constanta lui Planck ( ) dacă ar fi reprezentate ca numere cu virgulă mobilă de patru cifre în baza cu un exces de ? (Aceasta ar fi reprezentarea în mașina MIX ca în ( ) dacă dimensiunea octeților ar fi ) [ ] Să presupunem că ordinul lui e este în intervalul y mod = ; ; și v = dacă și numai dacă u - sau v = ; (-u) v = u (-v) = -(u u); v = , rі = rі, rі rі = Dacă u , atunci u w w v dacă v > u > Dacă u (r) v = u + v, atunci (u ϵ v) Ѳ v = rі; dacă rі u = rіu^O, atunci (u v) v = u După cum puteți vedea, în ciuda "ineciziei" inerente a operațiunilor în virgulă mobilă, acestea au o regularitate semnificativă, dacă totul este gândit corespunzător Cu toate acestea, în setul de identități de mai sus, desigur, absența mai multor legi cunoscute ale algebrei este izbitoare; Legea asociativității pentru înmulțirea în format virgulă mobilă nu este valabilă exact, așa cum se vede din exercițiu În ceea ce privește legea distributivității, care leagă operațiile și φ, aceasta poate fi încălcată, și în acest caz destul de semnificativ Fie, de exemplu, u = , ѵ = - și w = ; Apoi (și și) (r) (și w) = - , (c) , = și (y (r) w) = = Prin urmare, și (v (c) w) (și v) (r) (și w) ( ) Pe de altă parte, b (ѵ (r) w) = (b v) (r) (b w) este într-adevăr adevărată când b este baza sistemului numeric, deoarece round(bar) = round(;r) ( ) (Strict vorbind, identitățile și inegalitățile discutate în această secțiune implică faptul că nu are loc nicio depășire sau depășire a ordinii Funcția round(ar) este nedefinită atunci când |x| este prea mic sau prea mare, iar egalități precum ( ) sunt valabile numai dacă ambele părțile sunt definite ) Un alt exemplu impresionant de încălcare a legilor algebrei tradiționale atunci când se lucrează cu numere în format virgulă mobilă este eșecul inegalității fundamentale Cauchy (* + • ■ • + x n)(YI + • • ■ + J/n) > (X Y + ■■■ + XnYn) Cum se poate întâmpla acest lucru este arătat în Ex și într-un caz complet obișnuit, când n \u d , xi - X \u d Programatorii începători au obiceiul de a folosi formula din cartea de referință pentru programul de calcul a abaterii standard pentru un număr de observații n(n - ) ( ) De multe ori, atunci când executați un program, "dați cu" o încercare de a extrage rădăcina pătrată a unui număr negativ! O metodă mult mai bună pentru calcularea mediei și a abaterii standard, având în vedere proprietățile operațiilor cu virgulă mobilă, este utilizarea formulelor recursive Mg = xr, Mk = Mk-i (r) (xk Ѳ Mk-i) k, ( ) Si= , Sk = к- (r)(хкѳМк і)(r)(хкѲМк) ( ) pentru ) (r) w ( + (r)w) ( + oo, atunci, cel mai probabil, va fi o greșeală să continui calculele până când pentru niște n egalitatea mn + i = mn este satisfăcută, întrucât succesiunea periodică cu o perioadă lungă Este rezonabil să se continue calculele doar până când, pentru unele alese corespunzător, inegalitatea |ip+i - mn| max( eu ?, ev î); ( ) și ~ ѵ (b) dacă și numai dacă - гі| - ѵ (b) dacă și numai dacă u - ѵ > emax(beu~q,bev~q'); ( ) și ѵ (b) dacă și numai dacă - гі| eo/( - |eo) De exemplu, pentru b = și p = , putem lua e = , Relațiile și " sunt utile pentru algoritmii numerici și, prin urmare, este rezonabil să se includă programe pentru compararea numerelor în virgulă mobilă în software-ul de sistem al unui computer împreună cu programe pentru efectuarea de operații aritmetice asupra acestora Acum ne întoarcem din nou la întrebarea de a găsi rapoartele exacte care sunt satisfăcute de operațiile pe numere în virgulă mobilă Este interesant de observat că adunarea și scăderea unor astfel de mărimi nu intră complet din câmpul de vedere al axiomaticii, deoarece satisfac identitățile netriviale formulate în următoarele teoreme Teorema A Fie u și ѵ numere în virgulă mobilă normalizate Apoi ((u (r)")Ѳi) + ((u (r) ѵ) Ѳ ((și ϵ) Ѳi)) = u f ѵ ( ) cu condiţia să nu se producă debordare sau dispariţie a ordinii Această identitate destul de greoaie poate fi rescrisă în următoarea formă mai simplă Sa punem u' = (u φ ѵ) Ѳ ѵ , ѵ' = (u φ ѵ) Ѳ u; ( ) u" = (ifi) Ѳ ѵ', ѵ" = (u Ф g) Ѳ u' Este intuitiv clar că u' şi u' trebuie să fie aproximări pentru u, iar v' şi v" trebuie să fie aproximări pentru v Teorema A afirmă că și ϵ ѵ = u' + ѵ" = u" + I)' ( ) Aceasta este o declarație mai puternică decât identitatea și ϵ ѵ = u' Ф ѵ" = u" (c) ѵ', ( ) care este o consecință a rotunjirii ( ) Dovada Vom spune că t este un rest al lui x (modulo le) dacă t = x (modulo be), |t| , atunci |u - r| > bp - |, iar din moment ce |r| bp - Rezultă că u este un număr întreg, astfel încât termenul i-rezidual v (modulo ) Dacă u' = u, atunci t - -g este restul -v În caz contrar, relația round(u - r) / u implică |u| = bp - , |r| = |, |u'| = bp, t = g; din nou, t este termenul rămas -v eu Teorema A dezvăluie ceva despre regularitatea adunării în virgulă mobilă, dar nu pare a fi un rezultat foarte util Următoarea teoremă este mult mai esențială Teorema B În ipotezele teoremei A și în condiția ( ), avem identitatea u + v = (u ϵ v) + ((u Ѳ u') φ (y Ѳ r")) ( ) Dovada Luând în considerare fiecare dintre cazurile apărute în demonstrarea teoremei A, constatăm invariabil că ambele (u - u') + (r - v") Prin urmare, ( ) rezultă din teorema A Dacă luăm în considerare notația adoptată în demonstrația anterioară, aceste relații se vor dovedi a fi echivalente cu următoarele: rotund(f + r) = t + r, rotund(i) = t, rotund(r) = r ( ) În ex consideră teorema pentru cazul special când |ei - ev| > r Altfel, u+v are cel mult p cifre semnificative și se poate arăta cu ușurință că round(r) = r Dacă acum e > , demonstrația teoremei A arată că t = -r sau t = r = ±| Dacă e e și ev > e sunt satisfăcute Dar fie ei |v|, atunci u + ѵ = (u f ѵ) -I- (u Ѳ (u Ф g)) Ф ѵ ( ) Dovada Urmând convențiile adoptate în demonstrarea teoremelor anterioare, este de dorit să se arate că ѵ Ѳv' = r Este suficient să arătăm că ѵ' = w - și, întrucât ( ) urmează apoi rotund(u + v - w) = rotund(r) = r De fapt, trebuie să demonstrăm ( ) pentru orice b ev Dacă eu > p, atunci r este restul lui v (modul ) Prin urmare, ѵ' = іѵѲu = ѵѲg = ѵ - r = w - u, care urma să fie dovedit Dacă ei - și ", definite mai devreme în această secțiune, își păstrează semnificația pentru numerele nenormalizate Ca exemplu de utilizare a acestor relații, să demonstrăm o lege de asociativitate aproximativă pentru adăugarea unor mărimi nenormalizate prin analogie cu ( ): (u f d) (c) w k și (c) (g f w) (s) ( ) pentru o e aleasă potrivit Avem |(ц Ф ѵ) Ф W - (u + V -I- w)| i, în notația sub formă de intervale va arăta ca u = [mo g/i], ѵ = [du-te r>i] Suma și (r) ѵ este [н V • • ыі А н], unde V înseamnă suma inferioară în format virgulă mobilă, adică cel mai mare număr reprezentabil în acest format care este mai mic sau egal cu valoarea reală a sumei și A este definit în mod similar (vezi exercițiul - ) Mai mult, Ѳ ѵ = [uq vo]l dacă uo și r>o sunt pozitive, atunci u (r) v = [uq V u Ui A ^iL și v = [uq V A o] De exemplu, Numărul lui Avogadro și constanta lui Planck în notația aritmetică a intervalelor vor arăta astfel: N = [( ,+ ) ( ,+ )], h = [(- , + ) (- , + )] Suma și produsul acestor cantități vor fi exprimate după cum urmează: N(r) h = [( , + ) ( , + )], N(r)h = [(- , + ) (- , + )] Dacă încercați să împărțiți la [r>o • • r>i] și r>o -, " introduse în această secţiune au o analogie cu ideile formulate în lucrarea lui A Van Wijngaarden, BIT ( ), - Teoremele de mai sus A și B sunt inspirate de unele lucrări în acest domeniu ale lui Ole Moller, BIT ( ), - , - Teorema C este preluată din T J Dekker, Numer Matematică ( ), - O extindere și o rafinare a tuturor celor trei teoreme este publicată în S Linnainmaa, BIT ( ), - W M Kahan a afirmat Teorema D în note nepublicate; dovada și comentariile sale complete sunt date în JF Reiser, D E Knuth, Inf Proc Scrisorile ( ), - , Utilizarea aritmeticii în virgulă mobilă nenormalizată a fost recomandată de F L Bauer și K Zamelzon în articolul menționat mai sus; folosit independent de JW Carr (JW Carr III) de la Universitatea din Michigan ( ) Câțiva ani mai târziu, computerul MANIAC III a fost proiectat să implementeze ambele tipuri de aritmetică în hardware (vezi RL Ashenhurst și N Metropolis, JACM ( ), - , IEEE Trans EC- ( ), - , RL Ashenhurst, Proc Spring Joint Computer Conf ( ), - ) Printre alte lucrări timpurii referitoare la aritmetica nenormalizată, trebuie menționate și lucrările lui H L Gray, C Harrison, Jr , Proc Eastern Joint Computer Conf ( ), - , şi W G Wadey, JACM ( ), - Pentru cercetări timpurii privind aritmetica intervalului, vezi A Gibb, CACM ( ), - ; V A Chartres, JACM ( ), - și Interval Analysis de Ramon E Moore (Prentice-Hall, ) "Înflorirea" ulterioară în acest domeniu este dată în cartea ulterioară a lui Moore, Methods and Applications of Interval Analysis (SIAM, ) O extensie a limbajului Pascal care permite utilizarea variabilelor precum "intervalul" a fost dezvoltată la Universitatea din Karlsruhe la începutul anilor Pentru o descriere a acestui limbaj, care include multe alte caracteristici orientate științific, vezi Pascal-SC (Academic Press, ); autorii sunt Bohlender, Ulrich, Wolff vOn Gudenberg și Rall Cartea Ulrich Kulisch, Grundlagen des numerischen Rechnens: Mathematische Be-griindung der Rechnerarithmetik (Mannheim: Bibi Inst , ) este în întregime dedicată studiului sistemelor de aritmetică în virgulă mobilă (Vezi, de asemenea, articolul lui Kulisch în IEEE Trans C- ( ), - , și lucrarea sa ulterioară cu W L Miranker intitulată Computer Arithmetic in Theory and Practice (New York: Academic Press, ) ) O prezentare excelentă a celei mai recente lucrări privind analiza acurateței în virgulă mobilă este NJ Higham, Accuracy and Stability of Numerical Algorithms (Philadelphia: SIAM, ) EXERCIȚII Cometariu Dacă nu se specifică altfel, se presupun operații pe numere în virgulă mobilă normalizate [M ] Demonstrați că identitatea ( ) rezultă din relațiile ( )-( ) [M ] Folosind identitățile ( )-( ), demonstrați că (u (r) x) (r) (r (r) y) > și (r) v, oricare ar fi x > și y > [JW ] Găsiți numere zecimale cu virgulă mobilă din cifre și ѵ și w, pentru care și g> (r w) / (u v) w, și nici depășirea și nici dispariția ordinii nu se produce în niciunul dintre aceste calcule [ ] Este posibil să se găsească numere în virgulă mobilă u, ѵ și w pentru care ordinea dispare când se calculează u (v w), dar nu apare când se calculează u (v w)? [M ] Este valabilă egalitatea u v - u ( v) pentru toate numerele în virgulă mobilă u și v / în așa fel încât să nu aibă loc nici depășirea, nici dispariția ordinii? [M ] Pentru fiecare dintre următoarele două relații, aflați dacă este valabil pentru toate numerele și în format virgulă mobilă: (a) Ѳ ( Ѳ u) = u; (b) ( și) = și [M ] Fie u(r) înseamnă și și Găsiți numere binare în virgulă mobilă u și ѵ astfel încât (u (r) v)(r) > (u(r) + ѵ(r)) ► [ ] Fie e = , ; care dintre rapoarte u - - ѵ (e), u " v (e) este valabil pentru următoarele perechi de numere zecimale cu virgulă mobilă de cifre cu un exces de ? a) u = ( , + ), ѵ = ( , + ); b) u = ( , + ), ѵ = ( + ); c) u = ( , + ), v = ( , + ); d) u = ( , + ), ѵ = ( , + ); e) și = ( , + ), ѵ = ( , + ) [M ] Demonstrați afirmația ( ) și explicați de ce nu poate fi întărită la u w (ei + e ) ► [M ] (W M Kahan ) Pe unele computere, aritmetica în virgulă mobilă nu se rotunjește corect și, de fapt, programul de înmulțire ia în considerare doar primele p cifre semnificative p-bit produs fufv (Astfel, dacă fufv ѵ w [M ] Demonstrați Lema T [M J] Demonstrați teorema B și ( ) dacă |ee - ev| > r ► [M ] Unele limbaje de programare (și chiar unele computere) funcționează numai pe numere în virgulă mobilă, fără a separa operațiile exacte pe numere întregi într-un grup separat Dacă se dorește și operații pe numere întregi, se pot reprezenta în mod natural în format virgulă mobilă Atunci, dacă operațiile de aritmetică în virgulă mobilă satisfac relațiile de bază ( ), putem presupune că toate operațiile sunt efectuate exact în sensul că dacă operanzii sunt reprezentați prin p cifre semnificative, atunci p cifre semnificative vor fi exacte Mai departe, până când puteți fi sigur că numerele nu sunt prea mari, puteți adăuga, scădea și înmulți numere întregi și, în același timp, presupuneți că rotunjirea nu afectează precizia Dar să presupunem că programatorul dorește să determine dacă m este un multiplu exact al lui n când m și n / sunt ambele numere întregi Apoi, să presupunem că avem o rutină pentru a calcula round(u mod ) = și (mod) pentru orice număr dat și în format virgulă mobilă, ca în Ex - Ca o modalitate adecvată de a determina dacă m este un multiplu al lui n, se poate testa (m n) (mod) = , presupunând existența subrutinei de mai sus Dar, poate, în unele cazuri, această verificare nu va da un rezultat adecvat din cauza erorilor de rotunjire la efectuarea calculelor în format virgulă mobilă Găsiți condiții adecvate pentru a fi impuse unui interval de valori ale numerelor întregi n și m astfel încât m este un multiplu al lui n dacă și numai dacă (m n) (mod) = Cu alte cuvinte, arătați că dacă m și n nu sunt prea mari, acest test dă rezultatul corect [M ] Găsiți o valoare adecvată a lui e astfel încât (u v) w și u (v w) (e) dacă înmulțirea nu este normalizată (Acest lucru generalizează relația ( ), deoarece înmulțirea nenormalizată a operanzilor normalizați u, ѵ și w repetă exact rezultatul înmulțirii normalizate ) ► [M J] (G Bjork) (Cu alte cuvinte, rezultă cu adevărat din u în ( ) Pentru orice Хі, , Hk- [ ] Scrieți o rutină FCMP pentru MIX care compară numărul în virgulă mobilă u la adresa ACC cu numărul în virgulă mobilă v din registrul A și setează indicatorul de comparație la LESS, EGAL sau GREATER corespunzător rezultatului u - ~ ѵ (e) Aici, e este stocat la adresa EPSILON ca o valoare nenegativă cu un punct de separare fixat la stânga celui mai semnificativ bit al cuvântului Se presupune că valorile de intrare sunt normalizate [A/^ ] Există o valoare adecvată a lui e în aritmetica numerelor nenormalizate astfel încât u (u φ w) ss (u v) φ (u w) (e) ? ► [MZO] (W M Kahan) Analizați următoarele proceduri pentru însumarea xi, ,Xn în format virgulă mobilă: in = Co = ; Uk=XkѲSk-i, Sk=Sk-i(r)yk, ck = (sk Ѳ sk-i) uk, unde |y*|, avem egalitatea exactă când rezultatul unei operații în virgulă mobilă nu este rotunjit foarte clar, pe singura presupunere că fiecare operație produce o eroare relativă limitată ] [ ] (S Linnainmaa) Găsiți toate u și ѵ pentru care |și| > |r|, în timp ce relația ( ) nu este satisfăcută [L/ ] (T J Dekker ) Teorema C arată cum se face adunarea "exactă" în virgulă mobilă Arătați cum să efectuați înmulțirea "exactă" în virgulă mobilă: Exprimați produsul uv ca w + w , unde w și u sunt calculate din numerele în virgulă mobilă u și ti date folosind numai operațiile φ, Ѳ și [M ] Poate apărea deriva la înmulțirea și/sau împărțirea în format virgulă mobilă? Se consideră șirul xo = u, x n+i = ^ n r, X n+ = X n+i v pentru u dat și v / Care este valoarea celui mai mare indice k pentru care condiția Xk este ► [L/ ] Demonstrați sau infirmați următoarea afirmație: pentru toate numerele și în format virgulă mobilă, egalitatea uQ (u (mod) ) = [uj [L/ ] Luați în considerare mulțimea tuturor intervalelor [u; u], unde u și u sunt fie numere diferite de zero în format virgulă mobilă, fie simbolurile speciale + , - , +oo, - oo Fiecare interval trebuie să aibă u este o condiție necesară pentru exercițiul anterior ► [L/ ] (U M Kahan ) (y) = /((| - y )( + y )) pentru (cos) y pentru ev, ci și |u| > |v| Atunci poți fi sigur că semnul rezultatului va fi semnul și În alte privințe, un program de adăugare de precizie dublă este foarte asemănător cu un program de precizie unică, dar totul se face de două ori Programul A (Adăugare dublă precizie) Subrutina DFADD adaugă un număr în virgulă mobilă cu precizie dublă vo în format ( ) la un număr în virgulă mobilă cu precizie dublă u Mai mult, se presupune că ѵ înainte de începerea execuției programului este introdus în gAX (registrele A și X), a și este stocat inițial în celulele ACC și ACC Rezultatul apare simultan în GACH și în (ACC, ACC) Subrutina DFSUB scade ѵ din și urmând aceleași convenții Se presupune că ambii operanzi de intrare sunt normalizați, iar rezultatul este, de asemenea, normalizat Fragmentul final al programului este o procedură de normalizare cu dublă precizie utilizată în celelalte subrutine din această secțiune În ex Figura arată cum acest program poate fi îmbunătățit semnificativ ABS EQU : Definiție câmp pentru valoarea absolută SIGN EQU : Definiția câmpului pentru semn EXPD EQU : Câmp exponent pentru format dublă precizie DFSUB STA TEMP Scădere dublă precizie LDAN TEMP Schimbați semnul ѵ DFADD STJ EXITDF Adăugare dublă precizie CMPA ACC(ABS) Comparare |v| c |u| JG F JL F CMPX ACCX (ABS) JLE F H STA ARG Dacă |v| > |u|, faceți o înlocuire reciprocă și • ѵ STX ARGX și LDA ACC LDX ACCX ENT ACC (ACC și ACCX sunt în MOVE ARG( ) celule consecutive ) H STA TEMP LD N TEMP(EXPD) ii Vc V STX ARGX v v v STA ARGX(SIGN) Amintiți-vă semnul ѵ corect în ambele jumătăți LDA ACC (Se știe că și are un semn de rezultat ) LDX ACCX GACH +- și SLAX Ștergeți comanda STA ACC Ui U U U U& SLAX ENTX STX EXPO EXPO ) LDA ACC gA +- wm cu semn corect JMP DNORM Normalizează și ieși din subrutină DVZROD HLT Divizor nenormalizat sau zero H EQU ( : ) WM CON B- ,BYTE- ( : ) Lungimea cuvântului minus unu eu Mai jos este un tabel cu valorile aproximative ale timpilor medii de execuție pentru programele de dublă precizie considerate în comparație cu caracteristicile corespunzătoare ale rutinelor de calcul cu o singură precizie din Secțiunea Precizie simplă Precizie dublă Adăugarea i i Scăderea , i i Înmulțirea și și Divizia și , m Pentru mai multe informații despre generalizările metodelor din această secțiune pentru calcule cu triplă precizie în virgulă mobilă, vezi W Ikebe, CACM ( ), - EXERCIȚII [ ] Încercați să implementați manual împărțirea cu precizie dublă a cu , presupunând că e = (Puneți (um,ui) = ( , ) și (ѵm,vi) = ( , ) ) și găsiți câtul folosind metoda descrisă în text după formula ( ) ) [ ] Ar trebui introdusă comanda "ENTX " între rândurile și ale programului M pentru a preveni influența nedorită asupra acurateții rezultatelor informațiilor rămase în registrul X? [M ] Explicați de ce programul M nu poate depăși [ ] Cum ar trebui modificat programul M pentru a obține o creștere a preciziei prin deplasarea liniei verticale prezentate în fig , o poziție la dreapta? Listați orice modificări care trebuie făcute și stabiliți cum se va schimba timpul de execuție ► [ ] Cum ar trebui modificat programul A pentru a îmbunătăți acuratețea trecând la un acumulator de octeți în loc de octeți la dreapta punctului de separare? Listați orice modificări care trebuie făcute și stabiliți cum se va schimba timpul de execuție [ ] Să presupunem că același program principal utilizează atât rutinele cu precizie dublă din această secțiune, cât și rutinele cu precizie simplă din Secțiunea Dezvoltați o rutină care convertește un număr din formatul cu precizie simplă în format cu precizie dublă, respectiv ( ) De asemenea, dezvoltați o altă subrutină care convertește un număr cu precizie dublă într-un număr cu precizie unică (sau raportează o depășire sau o nerespectare dacă conversia nu este posibilă) ► [Mî ] Evaluați acuratețea calculelor din subprogramele acestei secțiuni, lucrând cu formatul de dublă precizie, căutând constante adecvate și |v|, iar baza sistemului numeric este Aici |r| |v|, Dekker a propus să calculeze mai întâi exact u + v = w + r, apoi valoarea aproximativă a restului s = (r(r)v')(r)u', iar în final să returneze valoarea (w Fe, (w Ѳ (w (r) c)) (r) h) Analizați acuratețea și eficiența acestei abordări atunci când este utilizată recursiv pentru calcule cu precizie cvadruplă Distribuția numerelor în virgulă mobilă Pentru a oferi o imagine medie a comportamentului algoritmilor care utilizează aritmetica în virgulă mobilă (și în special pentru a determina timpul mediu de execuție al unor astfel de algoritmi), sunt necesare câteva informații statistice pentru a calcula frecvența de apariție a diferitelor cazuri Această secțiune va analiza proprietățile empirice și teoretice ale distribuției numerelor în virgulă mobilă A Programe de adunare și scădere Timpul de execuție al operațiilor de adunare și scădere a numerelor în virgulă mobilă depinde în mare măsură de diferența inițială a comenzilor, precum și de numărul de pași de normalizare necesari (stânga sau dreapta) Nu există încă un model teoretic bun care să prezică performanța așteptată, dar avem rezultatele cercetării empirice extinse de DW Sweeney [DW Sweeney, IBM Systems J ( ), - ] Folosind un program special de urmărire, Sweeney a urmărit execuția a șase programe de calcul "eșantion" de mare complexitate, selectate în diferite laboratoare de calcul și a examinat cu atenție fiecare adunare și scădere de numere în virgulă mobilă Peste de astfel de tranzacții au fost implicate în procesul de colectare a acestor date Aproximativ una din zece instrucțiuni executate de programele testate a fost fie FADD, fie FSUB Deoarece scăderea nu este altceva decât adunare, în care al doilea operand este luat cu semnul opus, toate aceste statistici pot fi considerate ca aparținând doar adunării Rezultatele lui Sweeney pot fi rezumate după cum urmează Unul dintre cei doi termeni a fost egal cu zero în aproximativ % din toate cazurile și, de obicei, era acumulatorul (ACC) Restul de % din cazuri au fost distribuite aproximativ egal între semnele aceleași și opuse ale operanzilor, precum și aproximativ egal între cazurile când |și| - log s) dacă c - log s) dacă c > r; {p(r/c) + - p( /c) dacă c r Extindem acum funcția p(r) în afara intervalului și Dar nu există nicio funcție de distribuție F care să satisfacă această egalitate pentru toți astfel de b și r (vezi exercițiul ) O cale de ieșire din această problemă este să luăm în considerare legea logaritmică p(r) = log r doar ca o aproximare foarte bună a distribuției adevărate Poate că adevărata distribuție se schimbă pe măsură ce universul se extinde, făcând aproximarea noastră din ce în ce mai bună în timp; și, dacă înlocuim baza cu o bază arbitrară b, aproximarea noastră va fi cu cât mai puțin precisă (la un moment dat), cu atât b mai mare O altă modalitate destul de atractivă de rezolvare a dilemei, asociată cu respingerea conceptului tradițional al funcției de distribuție, a fost propusă de R A Raimi [R A Raimi, AMM ( ), - ] Raționamentul ornamentat al ultimului paragraf, aparent, nu poate fi considerat în niciun fel o explicație satisfăcătoare, așa că ar trebui să fim foarte pozitivi cu privire la calculele de mai jos (unde aderăm la un canon matematic strict și evităm orice intuitiv (și, în plus, paradoxal) ) concepte teoria probabilității) Să luăm în considerare, în loc de distribuția unui set imaginar de numere reale, distribuția valorilor cifrelor principale (cele mai semnificative) ale numerelor întregi pozitive Studiul acestei întrebări este extrem de interesant, nu numai pentru că pune în lumină distribuțiile de probabilitate pentru datele în virgulă mobilă, ci și pentru că este un exemplu foarte instructiv de combinare a metodelor de matematică discretă cu metodele de calcul infinitezimal În toate argumentele ulterioare, r va desemna un număr real fix, Po( ), • • există o succesiune infinită de și , cu corespunzătoare aparițiilor care contribuie la valoarea probabilității pe care o căutăm Se poate încerca să "medieze" această secvență prin setare P (n) = -* P (k) ( ) n k=i Astfel, dacă generăm un număr întreg aleatoriu între și n folosind tehnica capitolului și îl convertim în format zecimal cu virgulă mobilă (e,/), atunci probabilitatea ca / r dacă înlocuim [ nsJ + cu [ nj] Apoi obținem valoarea limită (r - )/ pentru s > r [Vezi J FYanel, Naturforschende Gesellschaft, Vierteljahrsschrift (Ziirich, ), - ] Cu alte cuvinte, secvența (Pi(n)) conține subsecvențe (Pi( ns)) a căror limită crește de la (r - )/ la (r - )/ r și apoi scade la (r - ) / pe măsură ce s crește de la la r și apoi de la r la Aceasta arată că secvența Pi(n) nu are limită ca n -> oo și că valorile lui Pi(n) pentru n mare nu pot fi considerată prea bună aproximare a limitei log r la care speram! Deoarece Pi(n) nu tinde spre o anumită limită, putem încerca din nou să folosim aceeași idee ca în ( ) pentru a "medie" acest comportament anormal al secvenței noastre În general, să punem Pm+i(n) = -^Pm(k) ( ) n *=i Atunci Pm+Dn) va tinde să se comporte mai corect decât Pm(n) Să încercăm să confirmăm acest lucru cu calcule cantitative Experiența acumulată în considerarea cazului particular când m = sugerează că are sens să se ia în considerare subsecvența Pm+i( ns) În acest fel, se poate demonstra următorul rezultat Lema Q Pentru un întreg arbitrar m > și un număr real arbitrar c > , există funcții Qm(s; Rm(s) și un întreg Nm(e) astfel încât pentru n > Nm(e) și r] I r] ( ) Să demonstrăm lema prin inducție pe t Mai întâi rețineți că Qi(s) = ( + ( - ) - ( - r)/ )/ = + (r - )/ și /z Din ( ) aflăm că |Pi( ns) - Si(s)| = O(n)/ "; aceasta demonstrează lema pentru m - Pentru m > avem Pm ( pz) \u d - ( Y - - Y ѵ 's \ p ^ ' <> AGm i(b) Și deoarece funcția Sm i(i) este continuă și deci Riemann integrabilă, diferența ( ) Sm-i(t)dt mai mic decât b pentru toate j mai mari decât un număr N, care nu depinde de q, după cum reiese din definiția integrabilității N poate fi ales mai mare decât AD-db) , Orez Probabilitatea ca cea mai semnificativă cifră să fie Prin urmare, pentru n > N diferența / gyu g " pm(ioni) - - Y t - / sm-!(t)dt+ s^ejdt "Ko^n ( ) este mărginită de valoarea numerelor întregi pozitive j În cele din urmă, suma Z)o , există un număr N(e) astfel încât |Sm(s) - log r| N(e) Dovada Pe baza Lemei Q, acest rezultat poate fi demonstrat dacă arătăm că există un număr M care depinde de e astfel încât pentru toți M inegalitățile sunt valabile |Qm(s)-log r| = ( /t)g - g - ( ) Pentru a finaliza analiza, este necesar să se analizeze proprietățile asimptotice ale coeficienților C(z) Factorul din paranteze din expresia ( ) tinde spre n( /r)/In = - log r ca z -> , de unde rezultă că C(r) + = R(z) - g ( ) este o funcție analitică a variabilei complexe z în domeniul circular n și pentru toate valorile reale ale lui r din intervalul /b Presupunând că operanzii sunt independent logaritmici, găsiți probabilitatea ca să nu fie necesară nicio deplasare la stânga pentru a normaliza rezultatul ► [JL/ ] Fie U și V numere în virgulă mobilă pozitive normalizate aleatoriu având părți fracționale cu distribuție logaritmică independentă și fie p probabilitatea ca diferența ordinelor lor să fie egală cu k Presupunând că distribuția lui ordinele nu depinde de distribuția părților fracționale, se derivă o formulă care, prin baza b și valorile po, Pi, Pr, • • ■ exprimă probabilitatea ca la efectuarea adunării ( fV, să se producă "depășire fracțională" Comparați rezultatul cu rezultatul exercițiului (ignorați rotunjirea) [HM ] Fie t , V, po, Pi, ■ ■ ■ la fel ca în exercițiu și să fie folosită aritmetica de bază respectați întocmai legea logaritmică și, de fapt, probabilitatea ca cea mai mare cifră a sumei U f V să fie egală cu este întotdeauna strict mai mică decât log [HM ] (P Diaconis ) Fie Po(n) sau pentru fiecare n Determinați "probabilitățile" Pm+i(ri) prin mediere repetată ca în formula ( ) Arătați că dacă limn-ioo Pm(n) nu există, atunci nici limn-ioo Pm(n) pentru orice m [Indicație Demonstrați că an -+ numai dacă avem (aH-ban)/n -+ și an+i ] ► [YAL/ ] (M Tsuji (M Tsuji) ) O altă modalitate de a determina valoarea probabilității Pr(S(n)) este calcularea mărimii ^(^)]A); se poate arăta că această probabilitate armonică există și este egală cu Pr(S(n)), dacă numai aceasta din urmă există în conformitate cu Definiția A Demonstrați că probabilitatea armonică a expresiei "(logi n) mod Să presupunem în continuare că P(La) este definit pentru toate numerele întregi pozitive a, unde La este mulțimea tuturor numerelor întregi pozitive a căror reprezentare zecimală începe cu a: La = {n I ma [ZJM ] (RL Duncan) Demonstrați că valorile cifrelor principale din numerele Fibonacci respectă legea logaritmică pentru părțile fracționale: Pr( /rn oo ARITMETICA DE PRECIZIE MULTIPLA Să luăm acum în considerare operațiile pe numere de precizie arbitrar ridicată Pentru simplitatea prezentării, vom presupune că ne referim la numere întregi, și nu numere al căror punct de separare este în interiorul numărului Algoritmi clasici În această secțiune, vor fi luați în considerare algoritmii pentru implementarea următoarelor operațiuni: a) adunarea și scăderea numerelor întregi de n biți pentru a produce un rezultat pe n biți și un bit de transport; b) înmulțirea unui număr întreg de m biți cu un întreg de n biți pentru a produce un rezultat (n + /bit); c) împărțirea unui număr întreg de (n + m) biți la un număr întreg de n biți pentru a produce un coeficient de (m + ) biți și un rest de n biți Acești algoritmi pot fi numiți clasici, deoarece cuvântul "algoritm" în sine a fost folosit de secole în legătură cu implementarea proceselor de calcul Termenul "întreg de n biți" înseamnă orice număr întreg nenegativ mai mic decât unde b este baza sistemului obișnuit de numere poziționale în care sunt reprezentate numerele; astfel de numere din acest sistem sunt scrise folosind nu mai mult de n "biți" Algoritmii clasici pentru numere întregi pot fi extinși într-un mod evident la numere cu un punct de separare în cadrul unui număr sau numere în virgulă mobilă specificate cu o precizie crescută (la fel ca în mașina MIX, operațiile aritmetice definite pentru numerele întregi sunt extinse la aceste cazuri mai generale ) În această secțiune, vom lua în considerare algoritmi pentru efectuarea operațiilor enumerate (a)-(c) asupra numerelor întregi reprezentate în sistemul pozițional în baza b, unde b este un întreg dat egal sau mai mare decât Astfel, acești algoritmi sunt destul de definiții generale procese aritmetice și, ca atare, nu sunt asociate cu niciun computer anume Cu toate acestea, discuția va fi oarecum orientată spre mașină, deoarece ne interesează în principal metodele eficiente de efectuare a calculelor de înaltă precizie cu un computer Deși exemplele date sunt concentrate pe computerul ipotetic MIX, în esență același raționament se aplică aproape oricărei alte mașini Pentru a înțelege esența numerelor de înaltă precizie, cel mai important este că acestea pot fi considerate numere scrise într-un sistem numeric bazat pe w, unde w este dimensiunea cuvântului De exemplu, un număr întreg care umple cuvinte mașină în memoria computerului, a cărui dimensiune a cuvântului este w = IO , are de zecimale Cu toate acestea, îl vom trata ca pe un număr de biți în baza IO Această abordare este justificată de aceleași considerente ca și tranziția, de exemplu, de la binar la hexazecimal; grupăm doar biții (vezi expresia -( )) Luând în considerare aceste acorduri, vom lua în considerare următoarele operațiuni elementare: ao) adunarea și scăderea numerelor întregi cu o singură cifră cu un rezultat dintr-o singură cifră și un bit de transport; bo) înmulțirea unui întreg dintr-o singură cifră cu un întreg dintr-o singură cifră pentru a produce un rezultat de două cifre; c ) împărțirea unui număr întreg de doi biți la un număr întreg de un bit, care oferă un coeficient ca un întreg de un bit și un rest de un bit Odată ce lungimea cuvântului este setată corect, dacă este necesar, aceste operațiuni vor fi disponibile pentru execuție pe aproape fiecare computer Prin urmare, formulăm algoritmii (a), (b) și (c) enumerați mai sus în termenii operațiilor elementare (ac), (bo) și (c ) Deoarece numerele întregi de înaltă precizie sunt tratate ca numere în baza b, este util să ne imaginăm situația corespunzătoare cu b = , presupunând că operațiile aritmetice sunt efectuate manual Atunci operația (ao) este analogă cu memorarea tabelului de adunare, operația (bo) este analogă cu memorarea tabelului înmulțirii, iar operația (co) este, în esență, memorarea tabelului de înmulțire "inversat" Operațiile mai complexe (a), (b) și (c) pe numere de mare precizie pot fi acum implementate pe baza operațiilor simple de adunare, scădere, înmulțire și împărțire într-o coloană, care sunt predate copiilor din școala elementară De fapt, majoritatea algoritmilor care vor fi discutați mai jos nu sunt altceva decât reproduceri mecanice ale operațiilor familiare efectuate cu creion și hârtie Desigur, algoritmii vor trebui formulați mult mai atent decât în școala elementară În plus, este necesar să se depună eforturi pentru a minimiza memoria utilajului utilizat și timpul petrecut cu executarea programelor Pentru a evita argumentele plictisitoare și notațiile greoaie, vom presupune de la bun început că toate numerele folosite aici sunt nenegative Pașii suplimentari necesari pentru calcularea semnelor etc sunt destul de evidenti, deși trebuie avut grijă atunci când lucrați cu numere ca un complement pe un computer care nu utilizează reprezentarea directă a numerelor mari Aceste întrebări vor fi discutate la sfârșitul secțiunii Să începem cu adăugarea, care este cu siguranță o operație foarte simplă, dar totuși demnă de studiu atent, deoarece aceleași idei se găsesc și în alți algoritmi Algoritmul A (Adunarea numerelor întregi nenegative) Pentru numerele întregi nenegative de n biți date în baza b (un-\- ■ ■ 'U\Uo)b și (vn-i- ■ • wg'oP), acest algoritm generează suma lor (wnwn i ut wo)b- Aici wn este bitul de transport, întotdeauna sau Ai [Setare inițială ] Atribuiți} ] ) AZ [Loop over /] Incrementați j cu unu Dacă acum j (vn-i • • scrise în baza b, acest algoritm găsește diferența nenegativă (wn-i • ■ • WiWo)t> [Setare inițială ] Atribuiți j (Un-i •• -UiUo)b, ceea ce contrazice presupunerea făcută mai devreme;vezi mai jos exercițiul ) | La implementarea algoritmului într-un program MIX, este mai convenabil să stocați valoarea +k în loc de valoarea k, astfel încât la pasul S se poate calcula valoarea Uj - Vj + (l + k) + (b - ) ) (Reamintim că b este dimensiunea unui cuvânt mașină ) Ilustram algoritmul cu următorul program Programul S (Scăderea numerelor întregi nenegative) Acest program este similar cu programul A, dar în el rA = +k Ca și în alte programe din această secțiune, celula WM stochează constanta b - , valoarea maximă permisă care poate fi stocată în cuvântul mașină MIX (vezi programul D, rândurile - ) ENN N Sl Setarea inițială, j u ) Timpul de execuție al acestui program este de Y + cicluri, ceea ce este puțin mai lung decât pentru programul A Cititorul se poate întreba dacă nu ar fi mai bine să dezvolte un program combinat pentru adunare-scădere în loc de doi algoritmi diferiți A și S Dar analiza programelor arată că, în general, este de preferat să se utilizeze două programe diferite pentru a implementa aceste operații, astfel încât ca ciclul de calcul intern să fie efectuat cât mai repede posibil Următoarea noastră sarcină este înmulțirea Aici ideile folosite în construirea algoritmului A sunt dezvoltate în continuare Algoritmul M (Multiplicarea numerelor întregi nenegative) Având în vedere numere întregi nenegative de n biți (kp-i • • • și (cp-i • • • ѵіѵo)b în baza b, acest algoritm construiește produsul lor (wm+ni wy,wo)b- (Comun metoda Înmulțirea cu creion și hârtie se bazează pe găsirea mai întâi a produselor parțiale (um i uiUq) x Vj pentru U> WQ M M M MB M M M MB M [Setare inițială ] Setați toți parametrii wm i, wm , wq la zero Atribuiți j - (Dacă nu setăm toți parametrii wm-i, ,wo la zero, putem obține un algoritm mai general cu rezultatul (Wm+n i WQ)b "- ("ml • • • Mb X (^n- • ■ • Vo) + (wm i W )ft Acest algoritm de înmulțire și adunare este adesea folosit în aplicații* M [Multiplicator zero?] Dacă vj - , atunci atribuiți Wj+m - și treceți la pasul Mb (Această verificare poate economisi timp dacă probabilitatea ca Vj să fie zero este suficient de mare; în caz contrar, verificarea poate fi omisă fără a compromite corectitudinea algoritmului ) M [Setare inițială d ] Atribuiți i la , la la M [Înmulțiți și adăugați ] Mai întâi atribuiți t - u x Vj + Wi + j + k și apoi - wi + j - t mod b și k - [t / bj (Aici, bitul de transport k va aparține întotdeauna intervalului rii > ENN N j /( M + ) Dacă factorii sunt aleși aleatoriu, atunci ar trebui să ne așteptăm ca valoarea medie a acestei densități să fie de aproximativ /b, ceea ce este foarte mic Prin urmare, este în general neprofitabilă includerea pasului M , chiar dacă numărul b este mic Orez Scop: a determina rapid q H Vp - vivo)unip- ■ • • UiUo h -qv -> Algoritmul M nu este cel mai rapid mod de multiplicare dacă factorii de tip sunt mari, deși are avantajul (este simplu) Metode mai rapide, dar mai complexe sunt discutate în secțiunea ; deja la m = n = , este posibil să se înmulțească numerele mai rapid decât folosind algoritmul M Ultimul algoritm discutat în această secțiune este împărțirea lungă (m + număr întreg pe biți cu un întreg pe n biți Diviziunea lungă manuală convențională necesită ghicire în timpul calculului, ceea ce necesită o anumită abilitate din partea calculatorului Prin urmare, trebuie fie complet excludeți acest "proces creativ" din algoritm sau dezvoltați o anumită teorie care să îi permită formalizarea strictă Cea mai superficială analiză a procesului obișnuit de împărțire într-o coloană arată că întreaga problemă este împărțită în pași mai simpli, fiecare dintre acestea constând în împărțirea unui număr de (n + ) biți și a unui număr de n biți ѵ, unde q (în notația adoptată mai sus) Dovada Deoarece q unb + un-i -vn - i + Rezultă că u - qv q eu Să demonstrăm acum că în practică q nu poate fi mult mai mare decât q Să presupunem că q > q + Atunci unb + un i unbn Un- uu Vn-ib"- ~ Vn-ib"- v - bn~ (Cazul în care v = bn~ este imposibil deoarece dacă ѵ = ( )j, atunci q = g ) În plus, deoarece q > (u/v) - , că u v -bn v uf bn v \ v - bn~r U De aceea u ~ (v - bn~l\ v > ( b"- ) ~ Astfel, deoarece b - >q - >q = [u/vj > (vn-i - ), atunci vn-i [b/ ], atunci q - [b/ ] este foarte asemănătoare cu condiția de normalizare; într-adevăr, este exact aceeași cu condiția de normalizare pentru computerele binare O modalitate simplă de a vă asigura că vn-i este suficient de mare este să înmulțiți atât u, cât și v cu [b/(vn-i + !)] Acest lucru nu schimbă valoarea u/v, nu crește numărul de cifre în v și ex va avea întotdeauna ca rezultat o nouă valoare suficient de mare a vn-i- (O altă modalitate de normalizare a dividendului este discutată în Exercițiul ) Acum, înarmați cu toate aceste informații, putem dezvolta algoritmul necesar pentru împărțirea într-o coloană (Fig ) Folosește o metodă ușor îmbunătățită pentru alegerea q în pasul D , asigurându-se că q = q sau q - În practică, această metodă îmbunătățită pentru alegerea q oferă aproape întotdeauna o soluție exactă Dl Normalizare Orez Diviziune "lungă" Algoritmul D (Diviziunea numerelor întregi nenegative} Având în vedere numerele întregi nenegative u - (um+n i uiUo)(> și ѵ = (vn j ѵivo)b, reprezentate în baza b, presupunând că ѵn i / Oun> , găsim în sistemul numeric de bază b câtul [u/v] = (qmqm-i ■ ■ ■ o)t> iar restul și mod ѵ = (rn ! rіgo}b-(Când n = ar trebui să utilizați algoritmul mai simplu din exercițiul ) Dl [Normalizare ] Atribuiți d înmulțit cu d În mod similar, atribuiți (vp i gzio);, valoare (vp i vivo)b înmulțit cu d (Rețineți introducerea noului bit um+n la stânga lui um+n i; dacă d = , atunci tot ce trebuie să faceți în acest pas este să setați um+n la Pe un computer binar, s-ar putea să se dovedească că este de preferat să luați o putere de pentru d în loc de valoarea propusă aici, orice valoare a lui d care duce la inegalitatea vn-i > [ / J Vezi și exercițiul ) D [Setarea inițială J ] Assign ) m (Bucla j, care constă din pașii D -D , este în esență procesul de împărțire a (uj+n Uj+xUj)b la (vn ! vivo)b, care dă un bit din coeficientul qf, vezi Fig ) D [Calculează e ] Atribuiți q | (uj+nb + uj+n i)/vn iJ și să fie r restul, (uj+nb + Uj+nx) mod vn-i Verificați dacă inegalitatea q = b sau qvn- > bf + Uj+n- este satisfăcută, apoi micșorați q cu , creșteți r cu vn-i și repetați această verificare pentru r , atunci reveniți la pasul D D [Denormalizare ] Acum (qm b, atunci qvn- va fi j > D (Vezi exercițiul ) Fiți atenți la cât de ușor de implementat în mașină părea frumos calcule complexe și alegerea opțiunilor la pasul D De asemenea, observăm că programul pentru efectuarea pasului D este similar cu programul M, cu singura avertizare că ideile programului S sunt aplicate și aici Pentru a estima timpul de execuție al programului D, trebuie luate în considerare valorile parametrilor M, N, E, K și K prezentați în program (Aceste opțiuni nu iau în considerare situații care sunt foarte puțin probabil să apară; de exemplu, puteți presupune că comenzile din liniile de program - , , iar fragmentul corespunzător pasului D nu se execută niciodată ) Aici M + este numărul de cuvinte din coeficient, N este numărul de cuvinte din divizor, E este un număr care indică de câte ori se reduce q la pasul D , K și K' sunt numărul de setări "carry bits" în timpul execuției ciclului de "multiplicare-scădere" Presupunând că K + K este aproximativ egal cu (Lm + )(L/ + ) și că E este aproximativ egal, puteți obține că timpul total de execuție a programului este de aproximativ MN + ZOL + M + cicluri plus un suplimentar L + L/ + cicluri dacă d > (Aceste calcule au inclus fragmente de program de la exercițiile și ) Pentru M și N mari, acest timp este cu doar % mai lung decât timpul necesar programului M pentru a multiplica coeficientul și divizor Dacă baza b este relativ mică, astfel încât b este mai mică decât dimensiunea cuvântului mașină, procesul de divizare poate fi accelerat prin eliminarea condițiilor pentru ca valorile biților individuali ai rezultatului intermediar să cadă în intervalul [ ) (vezi D M Smith, Math Comp ( ), - ) Comentarii suplimentare despre algoritmul D sunt incluse în exercițiile de la sfârșitul acestei secțiuni Când depanați programe care implementează operații aritmetice cu precizie multiplă, puteți utiliza programe de înmulțire și adunare pentru a verifica rezultatele executării unui program de împărțire Următoarele numere sunt uneori utile pentru testare: (tm - l)(tn - ) = tm+n - tn - tm + Pentru m b și (b + )/ b este probabilitatea ca un i + vn i + > b, unde un i și vn i sunt numere întregi independente distribuite uniform în intervalul Q(z,t) = l + t ^-P(z,t)+b-^Q(z,t^ Aceste două ecuații sunt ușor de rezolvat în raport cu P(z, t) și Q(z, t) Dacă punem G(z, t) = P(z, t) + Q(z, t) = Cn(z)ip, unde Gn(z) este funcția generatoare pentru numărul total de transporturi la adăugarea numerelor de n biți, obținem G(z,t) = (b - zt)/p(z,t), unde p(z,t) = b - |( + b)( + z)t + zt ( ) Rețineți că G(l,t) = /( - t) în deplină concordanță cu faptul că Gn(l) trebuie să fie egal cu (ca sumă a probabilităților tuturor evenimentelor posibile) Luând derivate parțiale ale lui ( ) față de z, obținem &G ( - zt)(b + - t) dz " " PM P(Z^ &G = } n -t (b+l- t) t (b-zt)(b+l- t) dz^ n() p(z, t) p(r, i) Să setăm acum z = și să extindem P(z, t) și Q(z, t) în fracții elementare: /t t ^ W = y ^( t) "(b l) (l t) + (bl) (b Z) + ( -l)( -t) J • Rezultă că numărul mediu de transferuri , adică așteptarea matematică a valorii K este egală cu ii ( ) iar varianța este G£(l) + G'n(l) - G'n(l) / p + b + / \" / \ "\ ~ V+I)- (b- ) + (bl) kJ (bl) kJ J ■ ( ) Astfel, în ipotezele făcute, numărul transferurilor este ceva mai mic decât Istorie și bibliografie Lăsăm cititorului istoria timpurie a algoritmilor clasici descriși în această secțiune ca un subiect interesant pentru studiu independent Aici va fi urmărită doar istoricul implementării lor pe computerele moderne Utilizarea numărului " ca bază a sistemului numeric în raport cu înmulțirea numerelor mari pe calculator a fost discutată de D N Lehmer (D N Lehmer) și J R Ballantine (J P Ballantine) [AMM ( ), - ] Aritmetica dublă precizie pentru calculatoare a fost discutată pentru prima dată de J von Neumann și H G Goldstine în introducerea unui manual de programare publicat pentru prima dată în [J von Neumann, Collected Works , - ] Teoremele A și B de mai sus se datorează lui D A Pope și M L Stein [CACM ( ), - ] Lucrarea lor oferă, de asemenea, o bibliografie a lucrărilor anterioare despre aritmetica cu dublă precizie Alte modalități de alegere a coeficientului de probă q sunt discutate de A G Cox (A G Cox) și G A Luther (H A Luther) în CACM ( ), [împărțirea la n i + în loc de n i] și, de asemenea, de M L Stein în SACM ( ), - ) [CACM ( ), - ] a arătat că studiul restului de diviziune cu o singură precizie permite întărirea teoremei lui V Krishnamurti și Nandi [CACM ( ), - ] a propus o metodă de înlocuire a normalizării și denormalizării în algoritmul D prin calcularea q, care se bazează pe analiza mai multor cifre de început ale operanzilor O analiză interesantă a algoritmului original al lui Pope și Stein a fost făcută de G E Collins și D R Musser [Information Processing Letters ( ), - ] Au fost propuse și alte metode de împărțire ) "Divizia Fourier" [J Fourier, Analyse des Equations Determines (Paris, ), § ] În această metodă, adesea folosită în calculatoare, fiecare nouă cifră este obținută în esență prin creșterea preciziei reprezentării dividendului și divizorului la fiecare pas Un număr destul de mare de teste efectuate de autor au arătat că această metodă este mai proastă decât metoda "împărțiți și corectați" descrisă mai sus, dar în unele aplicații diviziunea Fourier este destul de acceptabilă (Vezi D G Lehmer în AMM ( ), - și Teoria ecuațiilor a lui J V Uspensky (New York: McGraw-Hill, ), - ) ) La primele calculatoare, care nu aveau o instrucțiune de divizare cu o singură precizie, "metoda lui Newton" a fost utilizată pe scară largă pentru a calcula reciproca unui număr Ideea lui este să găsească o aproximare inițială ho a numărului /v și să efectueze calcule suplimentare folosind formula Zhp + i \u d xp - vx " Această metodă asigură o convergență rapidă la /v, deoarece din egalitatea xn = ( - e)/v rezultă că £n+i = ( - e )/v Ordinea convergenței este trei, adică soluția poate fi găsită prin formula Xn+ = * Гп "b V(r)p) "b "(r)p) = CP ( + ( - ѴCP)( + ( - ѴCP))), înlocuind e cu O(e ) la fiecare pas S-au obţinut formule similare pentru al patrulea ordin de convergenţă (vezi P Rabinowitz, SACM ( ), ) Pentru calcule cu numere foarte mari, metoda lui Newton cu al doilea ordin de precizie (urmată de înmulțirea cu u) poate fi într-adevăr mult mai rapidă decât algoritmul D dacă acuratețea calculării xn u crește la fiecare pas în plus, utilizați programele de înmulțire rapidă din secțiunea (vezi algoritmul R) Mai multe scheme iterative conexe sunt discutate într-un articol de E V Krishnamurti, publicat în jurnalul IEEE Trans C- ( ), - ) O serie de metode de împărțire se bazează pe extinderea unui număr într-o serie (Vezi N N Laughlin, AMM ( ), - ) Am aplicat deja această idee la calcule cu precizie dublă (vezi expresia -( ) ) Pe lângă lucrările menționate mai sus, notăm următoarele lucrări dedicate aritmeticii cu precizie multiplă Programele de aritmetică în virgulă mobilă de înaltă precizie care utilizează un cod de întoarcere sunt descrise în A H Stroud, D Secrest, Comp J ( ), - Există o descriere a subrutinelor de precizie crescută destinate utilizării în programele scrise în FORTRAN (I Blum, CACM ( ), - ) și ALGOL (M Tiepagі, Suokonautio, BIT ( ), - ) ) Operațiile aritmetice pe numere întregi cu precizie nemărginită folosind metode de alocare a memoriei conectate au fost implementate elegant de G E Collins [CACA! ( ) - ] Pentru un set mai extins de operații cu precizie multiplă, inclusiv logaritmi și funcții trigonometrice, a se vedea R P Brent, ACM Trans Matematică Software ( ), - : DM Smith, ACM Trans Matematică Software ( ), - Realizările omenirii în tehnica de calcul sunt estimate în mod tradițional prin numărul de cifre zecimale ale numărului r, cunoscut în acest moment al istoriei Secțiunea a menționat câteva progrese timpurii în această sarcină În , Thomas Fantet de Lagny a calculat numărul ~ la de zecimale [Memoires Acad sci Paris ( ), - ; s-a făcut o eroare de tipar la caracterul ] Când au fost inventate formule mai perfecte pentru calcularea numărului r, faimosul calculator din Hamburg, Zacharias Dase, a avut nevoie de mai puțin de două luni în pentru a calcula de zecimale corecte pentru numărul r [CreLe ( ), ] Ulterior, în , William Shanks (William Shanks) a publicat zecimale pentru numărul mr Și-a continuat calculele până când, în , a determinat zecimale corecte mr [Cm W Shanks, Contributions to Mathematics (Londra, ); Proc Royal Soc Londra ( ), - ; ( ), - ; J C V Hoffmann, Zeit matematică blană și înțeleptul naturii Unterricht ( ), - ] Valoarea de cifre a lui r a fost folosită pe scară largă în cărți timp de mulți ani, până când D F Ferguson a observat în că avea mai multe erori începând cu a -a zecimală [Math Gazeta ( ), - ] În , ca parte a Zilei Muncii, G Reitwiesner și colegii săi au petrecut de ore de calculator pe un computer ENIAC pentru a calcula de cifre zecimale corecte ale numărului m [Math Tabele și Alte Ajutoare pentru Comp ( ), - ] F Genuys în a obținut de cifre după de minute de calcul pe un IBM [Chiffres ( ), - ] La scurt timp după aceea, D Shanks (a nu se confunda cu William!) și J W Rench (JW Wrench) au publicat de cifre, obținute după aproape ore de calcule pe computerul IBM și alte , ore de verificare [Math Comp ( ), - ] În urma verificării, au descoperit o eroare aleatorie în circuit, care a fost eliminată în timpul celei de-a doua numărări În , folosind de ore de timp de calculator pe un computer CDC , Jean Guilloud și Martine Bouyer de la Centrul francez de energie atomică au calculat un milion de cifre ale numărului r [cf A Shibata, Surikagaku ( ), - ] Cel mai surprinzător, cu șapte ani mai devreme, Dr IJ Matrix a prezis corect că milionul de cifră a lui mr ar trebui să fie [Martin Gardner, New Mathematical Diversions (Simon și Schuster, ), apendice la cap ] Bariera unui miliard de dolari a fost spartă în de către Gregory V Chudnovsky, David V Chudnovsky* și, în mod independent, de Yasumasa Kanada și Yoshiaki Tamura În , după de ore de calcule pe un computer paralel dezvoltat personal, soții Chudnovsky și-au extins rezultatul la două miliarde de cifre [Cm Richard Preston, The New Yorker ( martie ), - Noua formulă folosită de Chudnovsky este descrisă în Proc Nat Acad sci ( ), - ] În iulie , Yasumasa Canada și Daisuke Takahashi au calculat peste , miliarde de cifre folosind două metode independente, necesitând , și, respectiv, , ore, pe un computer HITACHI SR cu procesoare Vom aștepta noi recorduri în legătură cu trecerea la noul mileniu În această secțiune, ne-am limitat la metodele de efectuare a operațiilor aritmetice care sunt utilizate în programarea computerelor Există numeroși algoritmi pentru implementarea hardware a operațiilor aritmetice care prezintă un anumit interes, dar, aparent, nu sunt aplicabili programelor de calculator pentru lucrul cu numere de înaltă precizie (Vezi, de exemplu, GW Reitwiesner, "Binary Arithmetic", Advances in Computers (New York: Academic Press, ), - ; OL MacSorley, Proc IRE ( ), - ; G Metze , IRE Trans EC- ( ), - ; HL Garner, "Number Systems and Arithmetic", Advances in Computers (New York: Academic Press, ), - ) * G V Chudnovsky și D V Chudnovsky sunt absolvenți ai Universității din Kiev - Notă ed Un articol de A Edelman, publicat în SIAM Review ( ), - , descrie un "bug" necunoscut, dar foarte instructiv, în cipul Pentium dezvoltat în , asociat cu implementarea programului de fisiune Timpul minim de execuție hardware realizabil pentru operațiile de adunare și înmulțire a fost studiat în S Winograd, JACM ( ), - , ( ), - , R P Brent, IEEE Trans C- ( ), - și RW Floyd, FOCS ( ), - (vezi, de asemenea, secțiunea E) EXERCIȚII [ ] Studiați istoria timpurie a algoritmilor clasici pentru efectuarea de operații aritmetice pe produse originale de, să zicem, Sun Qiu, al-Khwarizmi, al-Uklidisi, Fibonacci și Robert Recorde și repuneți metodele lor cât mai precis posibil în strictă limbajul algoritmilor [ ] Generalizați algoritmul A astfel încât să efectueze adunarea într-o coloană, calculând sumele m numere întregi nenegative de n biți (Să presupunem că m ѵ, este satisfăcută [ ] Algoritmul S presupune că se știe dinainte care dintre cei doi operanzi sursă este mai mare Chiar dacă informațiile lipsesc, puteți începe și cumva să efectuați scăderea, dar se va constata că "împrumutul" suplimentar este păstrat până la sfârșitul algoritmului Construiți un alt algoritm în care să fie posibil să folosiți (dacă la sfârșitul algoritmului S există un "împrumut") complementul (Wn-i Wisho) și deci să calculați valoarea absolută a diferenței dintre u și v [ ] Dezvoltați un program pentru MIX care înmulțește (un-i ■ ■ ■ uiuo)(> nat, unde v este un număr arbitrar reprezentat cu precizie unică (adică, n + are doar un efect nesemnificativ asupra rezultatului Estimați eroarea maximă care poate apărea dacă produsele UiVj pentru i + j > n + se presupune că sunt zero în timpul înmulțirii în loc să fie calculate ► [ ] {Diviziune scurtă ) Construiți un algoritm pentru împărțirea unui număr întreg nenegativ de n biți (un i uiuo)i> la ѵ unde v este un număr întreg dat cu o singură precizie (adică o)b și restul r [M ] În notaţia fig să presupunem că cp-i > [ / J Arătați că, dacă un = vn-i, atunci trebuie să fie valabilă fie egalitatea q = - , fie egalitatea q = b - [M ] În notația fig arată că dacă q' = [(un + Un-i)/(fn-i + )J, atunci q' Arătați că dacă qvn- > bf + un- , atunci q L^/ J și qvn- ( - /b)v (Ultimul eveniment are loc cu o probabilitate de aproximativ / , deci dacă b este dimensiunea unui cuvânt mașină, atunci (cu excepții extrem de rare) algoritmul D trebuie să satisfacă qj = q ) ► [ ] Dați un exemplu de împărțire a unui număr de patru cifre la unul de trei cifre, pentru care pasul D trebuie inclus în algoritmul D dacă baza sistemului numeric este [M ] Demonstrați că pentru numere întregi date v și u astfel încât + )J + )J ii>o)i> pentru orice bază întreagă b cu i f Să facem următoarele N Dacă vp-i și efectuarea de operații aritmetice O(zilogTi) pe numere întregi O(log ti)-biți (Presumăm că cifrele binare ale numărului r nu conțin șiruri prea lungi de zerouri sau unu ) [M J] Uneori devine necesară împărțirea numărului u la numărul ѵ, când se știe dinainte că împărțirea se va face fără rest Arătați că, dacă u este un număr de n biți și v este un număr de ti-biți, astfel încât u mod v = , atunci puteți economisi aproximativ % din efortul de calcul în algoritmul D calculând mai întâi jumătate din coeficient, începând de la stânga la dreapta, iar apoi cealaltă jumătate de la dreapta la stânga ► [M ] Multe aplicații ale aritmeticii de înaltă precizie necesită recalcularea bazei numărului ti-digit w, care a fost inițial reprezentat în baza b Aceste calcule pot fi accelerate folosind tehnica propusă de Peter L Montgomery [Math Comp ( ), - ] A efectuat calculul restului de la dreapta la stânga în loc de direcția convențională de calcul de la stânga la dreapta a) Pentru numere date u = ±(um+n i uu )b, u> = (wn-i • • u"o)b și un număr w astfel încât wow' mod = , arătați cum pentru a calcula ѵ - ±(ѵп-і ■ ■■ ѵіѵо)b astfel încât relația bmv mod w = și mod w să se țină b) Pentru numere întregi cu semn ti-bit dat u, ѵ și w cu |u|, |i>| mj] (unsprezece) (uj - Vj) mod mj = Uj - Vj + mj[uj - ( ) Cu alte cuvinte, valoarea fiecărui modul este cu o mai mică decât următoarea putere de O astfel de alegere a valorii modulului mj simplifică adesea efectuarea operațiilor aritmetice de bază, deoarece este oarecum mai ușor de efectuat calcule cu numere reprezentate modulo e> - decât cu numerele reprezentate în codul invers După ce valorile modulelor sunt alese în acest fel, este util să slăbiți ușor condiția - ) ( ) Astfel, valoarea Uj = mj = e> - este considerată optimă în loc de Uj = , deoarece, pe de o parte, aceasta nu afectează validitatea Teoremei C, iar pe de altă parte, înseamnă că Uj poate fie orice binar de e biți număr Cu această ipoteză, operațiile de adunare și scădere modulo ch sunt efectuate după cum urmează: uj (r) vj = ((uj + vj) m°d e) + + Vj > ej] ( ) Uj (r) Vj = (v-jVj mod e') Φ l UjVj/ e'J ( ) (Aici φ(r) indică acțiuni care, ținând cont de condiția ( ), trebuie efectuate cu componente individuale (uj, , u) și (uj, , uj) în timpul adunării sau, respectiv, înmulțirii ) Când scăzând, se poate folosi și relația ( ) Puteți folosi și condiția Uj Ѳ Vj = ((Uj - Vj) mod e') - [uj După cum am observat deja, operațiunile de conversie la o reprezentare modulară și înapoi sunt foarte importante Reprezentarea modulară ("i, , u) pentru un număr dat u poate fi obținută prin împărțirea u la mn, , mn, amintindu-și resturile În cazul în care u = (vmvm x vo)b, este posibil să se utilizeze o metodă mai potrivită, care este de a calcula polinomul folosind aritmetica modulară ( (vmb + vm i) + • • •) b + VQ Dacă b = și modulele rrij au forma specială e> - , ambele abordări se reduc la o metodă foarte simplă Luați în considerare reprezentarea binară a numărului u cu blocuri de e;-biți: u - -a^-^A^ - • * * - -ap, ( ) unde A = e-' și - ), ( ) întrucât A = Prin urmare, Uj se calculează, ca în ( ), prin adăugarea numerelor de e biți a u, аѵ - u este multiplu al mr mr = m/mі, astfel încât ѵ > v - u > m/mi > mi Prin urmare, dacă inegalitatea ( ) pentru (u, v) nu este satisfăcută, aceasta va fi satisfăcută pentru perechea (u", v") = (v - ti, u + m - mj | Desigur, un rezultat similar poate fi demonstrat pentru orice mj în loc de ti; s-ar putea înlocui inegalitatea ( ) cu condiția a este numit automorf de către matematicieni-jokeri dacă ultimele n cifre ale lui x sunt egale cu x De exemplu, este un automorf pe biți, deoarece = Scientific American (ianuarie ), ] a) Demonstrați că un număr de n biți x > este un automorf dacă și numai dacă x mod n = (sau ) și, respectiv, x mod " = (sau ) (Astfel, dacă m = n și mt = n, atunci în ( ) numai numerele Mi și A/r sunt automorfe pe n biți ) b) Demonstrați că dacă x este un automorf pe n biți, atunci ( ; - m ) mod n este un automorf pe n biți c) Să se știe că cx = (modulo y) Găsiți o formulă simplă pentru un număr c' care este o funcție a lui cx, dar nu a lui y, care (formula) este c'x = (modulo y ) ► [MZO] (Înmulțire ticăloasă ) Prin definiție, convoluția ciclică (xo,(r)!, , xn i) și (yo, yi, • • • ,Yn-i) este (z ,zi, ,zn-i), unde Zk - xiyj pentru , ( ) dacă alegem o constantă c suficient de mare pentru ca această inegalitate să fie valabilă pentru k = ; deci avem T(n) , există o constantă c(e) și un algoritm de multiplicare astfel încât numărul de operații elementare T(n~) care trebuie efectuate pentru a înmulți două numere de n biți satisface estimarea T(n) (adică, r -> oo) Acest lucru duce la o creștere atât de rapidă a c(e) încât valorile foarte mari ale lui n trebuie tratate înainte de a putea fi aduse îmbunătățiri semnificative relației ( ) Teorema este nesatisfăcătoare și din punct de vedere teoretic, deoarece nu folosește pe deplin metoda polinomială de bază Dacă presupunem că r variază cu n, atunci alegând valori din ce în ce mai mari ale lui r pe măsură ce n crește, se poate obține un rezultat mai bun Această idee a fost propusă de A L Toom [DAN SSSR ( ), - ] Toom l-a folosit pentru a demonstra faptul că, pe măsură ce n crește, este posibil să se construiască un automat pentru înmulțirea numerelor cu n cifre, constând dintr-un număr destul de mic de componente Mai recent, S A Cook, în Op the Minimum Computation Time of Functions (Teza, Universitatea Harvard, ), - , a arătat cum ideea lui Toom ar putea fi aplicată pentru a accelera programele de calculator Înainte de a continua discuția despre algoritmul Toom-Cook, luați în considerare un exemplu simplu de trecere de la U(x) și V(;r) la coeficienții funcției IDm) În acest exemplu, eficacitatea metodei nu se simte, deoarece numerele folosite în ea sunt prea mici Dar exemplul demonstrează simplificări utile care pot fi aplicate în cazul general Să presupunem că trebuie să înmulțiți u = cu ѵ = sau în sistemul de numere binar numărul și = ( ) cu numărul ѵ = ( ) ( ) Fie r = Polinoamele U(x) și r(m) din ( ) au forma U (x) \u d t + t: + , V (x) \u d Eya -F x + De aici găsim pentru W(m) = U(x)V(x): [ ( ) = , VDO)= , IDO) = , ( )= , VD ) = , ID ) = , [ ( ) = , VD ) = , ID ) = , [ ( ) = , IDZ) = , IDZ) = , [ ( ) = ; ID ) = ; ID ) = ( ) Acum trebuie să găsiți cei cinci coeficienți ai polinomului ID i), folosind ultimele cinci valori Pentru a găsi coeficienții polinomului IM) = Wm-ixm~ + ••■ + W^x + ID pentru valorile date ale IDE), W(l), , W(m - ), poate fi folosit un algoritm interesant Mai întâi scriem ( ) unde x- = x(x - ) (x - k + ), iar coeficienții aj sunt necunoscuți Polinoamele de forma ( ) au o proprietate importantă: W (x + ) - IDt) - (t - ) at iX! E ^ + (t - ) at a: P ^ -IF ai; deci prin inducție obținem că pentru tot k > W(x+k) - (*}uDa;+L- ) + fyw(x+k- ) -+ (- )*IDa;) - ((tm) ~ l "t - I - k i ((tm) ~ \ p m - - k (\ / i - I] at-ix -FI \ at- X -F- + ab ki V Notând partea stângă a ( ) cu ( /A:!) Dk idt), observăm că Cd'= Î (+ ; - (^D'*II,(I)) și ( /A:!) Dk Y( ) = a*, Astfel, coeficienții aj pot fi calculați folosind o metodă foarte simplă, care este ilustrată aici prin exemplul polinomului VV(a:) definit prin relațiile ( ) / = / = / = / = / = / = ( ) Coloana din stânga a acestui tabel este formată din valorile date W( ), ID ), , W( ) Pentru a calcula intrările din coloana A-a, trebuie să găsiți diferența dintre elementele adiacente ale coloanei precedente și să împărțiți aceste diferențe la k Coeficienții aj sunt numerele de sus din coloane, deci a = , ai = , , = ; deci avem W(x) = a:â + t:- + m + t: + \u d ((( (a; - ) + ) (a; - ) + ) (a; - ) + ) m + ( ) În general, se poate scrie W(a;) = ( ((am i (x - mp + ) + am )(;g - m + ) + am )(m - mp + ) + • • • + ar) x + a Această formulă arată cum, folosind coeficienții am, se pot calcula coeficienții , ID Wq - - - - - • - - - - - - ~| ( ) În acest tabel, numerele de sub liniile orizontale sunt, respectiv, coeficienții polinoamelor ^ - ^ n- (x - mn + ) + ^ - " (at i(x - mp + ) + at- )( x - mp + ) + at etc Conform acestui tabel, avem W(x) = t + t + t + t + , ( ) deci răspunsul este - = IV( ) = unde IV( ) este calculat folosind operații de adunare și schimbare Secțiunea discută o generalizare a acestei metode pentru calcularea coeficienților Din identitatea de bază pentru numerele Stirling (vezi exercițiul -( )), n (n n (n (P xp \u d pa + - + i + i p I InJ J ) se poate observa că dacă coeficienții polinomului VV(m:) sunt nenegativi, atunci numerele a vor fi aceleași În acest caz, toate rezultatele intermediare din calculele de mai sus sunt nenegative Această împrejurare simplifică și mai mult algoritmul de multiplicare Toom-Cook, care va fi acum analizat în detaliu (Cititorii nerăbdători pot întoarce paginile subsecțiunii C ) Algoritmul T (Înmulțirea de înaltă precizie a numerelor binare) Având în vedere un întreg pozitiv n și două numere întregi nenegative de n biți u și ѵ, acest algoritm (Fig ) generează produsul lor de n biți w Patru stive auxiliare sunt folosite pentru a stoca numere lungi reprezentând rezultate intermediare ale executării algoritmului Stocarea temporară a U(j) și V(j) la pasul T Multiplicatori și coduri de control Stocarea valorilor IV(j) Aceste stive pot conține fie numere binare, fie caractere de control speciale numite "cod- ", "cod- " și "cod- " Algoritmul generează și un tabel suplimentar de numere qk, rk construit în așa fel încât să poată fi stocat în memorie ca o listă liniară, singurul indicator al căruia, deplasându-se prin listă în ambele direcții, poate fi folosit pentru a selecta element curent din această listă (Stivele C și IV sunt folosite pentru a controla mecanismul recursiv al algoritmului de multiplicare într-un mod destul de simplu, care este un caz special al procedurii generale discutate în capitolul ) TI [Calculează tabelele q,r ] Șterge stivele U, V, C și W și atribuie Stivele U, V Stiva C Stiva W k n este satisfăcută doar atribuiți R ■ Q, atunci trebuie să lăsați R neschimbat (vezi exercițiul ) La în acest pas, astfel de secvențe sunt construite k \u d O qk = mc = Orez Algoritmul Toom-Cook pentru multiplicare de mare precizie Dacă se înmulțesc numere de de biți, acest pas s-ar termina la k = , deoarece , atunci atribuiți fk, q • • ■ •, r- atribuiți W( t) +-W(t)-jW(t + ) (În buclă, j trebuie să scadă și t trebuie să crească Rezultatul acestei operații va fi din nou un întreg nenegativ care ocupă p biți; vezi Tabelul ( ) ) T [Generează răspuns ] Generați w (qk + c, și fie, în plus, C atât de mare încât inegalitatea ( ) este valabilă pentru k ko setăm Qk = lg p*, Rk = lg rk Prin inducție avem tk / | ca k -> oo Aceasta implică faptul că este posibil să se găsească ko astfel încât p ko Aceasta completează demonstrația inegalității ( ) prin inducție Ținând cont de rezultatul obținut, putem estima acum T(n) Deoarece n > + qk-i, atunci qk-i ,fc+ = pfc și, prin urmare la înmulțirea numerelor pk-biți u și ѵ, posibilitatea de depășire este complet exclusă Astfel, pentru k > , se poate folosi următoarea metodă a) Calculați u = umodmi, , u = umodm și u = u mod mi, , Vq = v mod mg b) Înmulțiți uj cu vi, "r cu "r, și ive cu ѵ$ Aceste numere constau în cel mult % + = % + ] = f je j mod ( f - ) ( ) Înmulțirea directă (cu) mod ( J - ) poate să nu fie suficientă pentru a rezolva problema, deoarece nu știm cum să înmulțim numerele /-biți de o formă generală în cicluri O(/log/) Dar forma specială a numărului c oferă un indiciu pentru soluție: reprezentarea binară a numărului c are o anumită structură regulată de biți, iar din formula ( ) se poate observa că numărul c[ b] poate fi obținut în un mod simplu de la numărul c[b] Această proprietate sugerează că este posibil să se înmulțească rapid un număr și cu c[ ], dacă se obține în mod corespunzător numărul c[ ] și în pași lgi> De exemplu, acest lucru se poate face după cum urmează Fie numărul b din sistemul binar să aibă forma b = (bs bibibo) - Se pot calcula patru secvențe de numere a*, dk, uk, ѵk, care sunt definite de reguli ar - e, - ts& i mod /; do = boe, dk = (dk-i + bk o + u-i^i H F u-i-i, ( ) și există o legătură strânsă între convoluții și un concept matematic important numit "transformata Fourier" Dacă w - exp( mr/K) este rădăcina K a unității, atunci se poate defini transformata Fourier unidimensională a secvenței de numere complexe (uq, ui, • • • >uk-i) ca șirul (yo , yi, ,id- i), unde îis = u>stut, o + Ur-iVi + • ■ • + U()Vr + uK-l^r+l + • • • + Tg+l^Kl = Y uivi- ( ) (modul K) În cazul în care K > n - și un = un+i = • • • = u^-i = vp = vp + i = • • • = mk-i = , numerele w sunt exact ceea ce este necesar pentru operația de înmulțire, întrucât în ( ) termenii cd - i^i+i + • ■ • + ui+iu ( ) întrucât pentru j care sunt multipli ai lui K, suma progresiei geometrice £ o n, cifrele de început din Uj și Vj sunt egale cu zero pentru toate j > K/ Valorile corespunzătoare pentru k și I vor fi alese mai târziu, când situația generală devine clară în procesul de rezolvare a problemei și se va putea lua în considerare toate informațiile disponibile atunci când alegeți k și I Următorul pas în procedura de înmulțire este calculul transformărilor Fourier (o, , dk i) și (o , • ■ •, vk-i) ale secvențelor (u , , id i) și (vq, unde prin definiție ut = Ut/ k+l vt = Vt/ k+l ( ) Pentru comoditate, scalarea se face în așa fel încât orice u și vt să fie mai mici de ~k, iar acest lucru, la rândul său, asigură că valorile absolute ale |d | și |d | se dovedesc a fi mai mic de pentru toate s Problema evidentă aici este că un număr complex nu poate fi reprezentat exact în binar Cum se calculează transformata Fourier de încredere? Providența a dorit ca rezultatul să fie corect chiar dacă, în cursul calculelor, s-au făcut cereri foarte modeste cu privire la acuratețea reprezentării numerelor Să lăsăm această problemă pentru moment și să presupunem că calculele sunt efectuate cu o precizie infinită O analiză a acurateței necesare va fi prezentată oarecum mai jos (în câteva pagini) Pentru us și vs rezultate, setăm ws = usvs ( țk-\ ul u k°, dacă j = (l-i • Jijoh- ( ) Deoarece fiecare valoare a lui oL este obținută ca urmare a înmulțirii u nu mai mult de k ori, erorile de calcul nu se acumulează cu această metodă Timpul total pentru calcularea tuturor valorilor oD este egal cu O(KAI), unde M este timpul pentru efectuarea operațiilor de multiplicare a numerelor complexe de m biți, deoarece este necesară o operație de multiplicare pentru a calcula fiecare dintre următoarele valori de oL din cel cunoscut anterior Executarea operațiilor ulterioare necesită mai multe cicluri decât O(KAI), deci calculul puterilor și necesită relativ puțin timp Fiecare dintre cele trei transformări Fourier constă din k treceri, iar fiecare dintre treceri implică K operații de forma a k + + log k + / Pentru a face acest lucru, este suficient să ceri ca k > și m > fc + să fie menținute ( ) Relațiile ( ) și ( ) pot fi utilizate pentru a determina astfel de valori ale parametrilor k, Ium, astfel încât operația de înmulțire să ia O(rі) + O(Mpc/ ) unități de timp, unde M este timpul de înmulțire a părților fracționale de m-biți De exemplu, pentru un computer MIX, să presupunem că numerele binare sunt înmulțite, fiecare dintre acestea fiind reprezentat de n = = biți Puteți alege valorile parametrilor k = , I = , m = , astfel încât operațiile necesare cu numere de m biți să nu fie altceva decât operații de înmulțire cu numere în aritmetică cu dublă precizie Prin urmare, timpul necesar pentru a efectua M operații de multiplicare a numerelor complexe de m biți va fi relativ mic Dacă punem, de exemplu, k = I = , atunci va trebui să ne ocupăm de operații de triplă precizie, care depășesc capacitățile de memorie ale mașinii MIX Pe un computer cu mai multe capacități, puteți, setând k \u d - um \u d , să înmulțiți două numere gigabit O analiză ulterioară a alegerii valorilor parametrilor k, I și m duce la o concluzie surprinzătoare: pentru majoritatea cazurilor practice, M poate fi considerat constant, iar timpul de execuție al procedurii de înmulțire Schönhage-Strassen este proporțional cu n Concluzia este că puteți alege k = I și m = fc; această alegere a lui k duce la faptul că timpul de execuție este întotdeauna mai mic decât Ign, deci nu este necesară mai mult de șase ori precizia de calcul, chiar dacă n este mai mare decât dimensiunea unui cuvânt mașină (În special, n poate fi mai mare decât dimensiunea registrului index, astfel încât numerele u și v pot să nu încapă în memoria principală ) Astfel, latura practică a înmulțirii rapide este rezolvată, cu excepția unei posibile îmbunătățiri a procedurii de alegere a constantelor Într-adevăr, algoritmul de convoluție pentru numere întregi arbitrare, dat în exercițiu - este cea mai bună soluție practică la problema înmulțirii de înaltă precizie Interesul nostru pentru problema înmulțirii numerelor mari este parțial teoretic, deoarece este interesant de explorat limitele complexității computaționale ale algoritmului Deci, să lăsăm pentru un moment partea practică a întrebării și să presupunem că numărul n este extrem de mare, poate mult mai mare decât numărul de atomi din univers Puteți considera m ca fiind aproximativ egal cu gn și puteți utiliza același algoritm recursiv pentru a multiplica numerele de m biți Timpul său de execuție va satisface expresia T(n) = O(n (logn)) Prin urmare, Г(п) oo, așa cum este descris în Secțiunea Astfel, putem concluziona că înmulțirea în O(n) pași este posibilă atât în practică, cât și teoretic În , D V Chudnovsky, G V Chudnovsky, M M Denno (M M Denneau) și S G Yunis (SG Younis) au proiectat un computer neobișnuit de uz general numit Micul Fermat, care putea înmulți rapid numere mari Calculatorul este echipat cu hardware pentru a efectua rapid operații aritmetice modulo + pe cuvinte de de biți Apoi, convoluția de tablouri constând din de cuvinte poate fi efectuată folosind de înmulțiri de numere cu un singur cuvânt împreună cu trei transformări discrete care necesită doar operații de adunare, scădere și schimbare Acest lucru a permis, pe baza principiului pipeline al organizării unui ciclu de aproximativ ns, să se înmulțească două numere întregi de biți în mai puțin de , s [Proc Al treilea int Conf despre Supercomputing ( ), - ; Matematică contemporană ( ), ] D Divizia Acum, cu programe eficiente de înmulțire, luați în considerare problema inversă Se pare că împărțirea se poate face la fel de rapid ca și înmulțirea, până la un factor constant Pentru a împărți numărul '-bit u la numărul '-bit v, se poate găsi mai întâi aproximarea '-bit la numărul /v, apoi se înmulţeşte cu şi, ceea ce dă q o aproximare la u/v, iar în final efectuați o altă înmulțire pentru a introduce o mică corecție în q pentru a vă asigura că inegalitatea Timpul petrecut la executarea algoritmului R este delimitat de sus de numărul de cicluri egal cu T( tg) + T( tg) + T(tg) + T(±tg) + • ■ • + O(n), unde T(ri) este o estimare superioară a timpului necesar pentru a efectua o operație de multiplicare pe n biți Dacă pentru o funcție monoton nedescrescătoare f(n) expresia pentru T(n) are forma nf(n), atunci T( n) + T( n) + T(n) + • ■ • la momentul t mașina Mj se află în starea (c, xq, Y , xi, yi, x, y, Z , z\, tho), vecinul său din stânga Mj-\ este în starea ( cz, xl , yl , x{,y{,xl,yl, zl , z{, Zq), în timp ce vecinul din dreapta Mj+i este în starea [, Zq) Apoi mașina Mj va trece la momentul t + la starea (c',XQ,y' ,x'x,y{,x',y',Z ,z[,ZQ), unde c' = min(c + , ) dacă c = , în caz contrar ; (x'q, y' ) = (x , y ) dacă c = , în caz contrar (x , y ); (хі, /() = (х ,у ) dacă с = , în caz contrar (хі,уі); (x', y') = (x , y ) dacă c > , în caz contrar (x, y); ( ) (z'zZiz'oh este notația binară pentru Zq + gі + Zș + ► [ ] (K Baker (K Baker) ) Să se arate că polinomul W(x) se calculează mai bine în punctele x = -r, , , , r decât la non -punctele negative x = , , , r, așa cum se face în algoritmul T Polinomul U(x) poate fi scris ca U(x) = Uc(x ) + xUo(x ) Polinoamele V(x) și W(x) pot fi exprimate în mod similar Arată cum să folosești această idee pentru a crește viteza calculelor la pașii T și T ► [ ] Arătați că dacă la pasul T al algoritmului T în loc de R ("o, • • ■, s*-i) în ( ), deoarece invers, transformarea Fourier va inversa din nou biții oricum [M ] Să presupunem că în metoda transformării Fourier descrisă în secțiune, în toate cazurile parametrul w este înlocuit cu wh, unde q este un număr întreg fix Găsiți o relație simplă între numerele (yo yi, ,yk-i) calculate folosind transformata Fourier generalizată și numerele (yo, yi, , yk-i) obținute cu q = [M ] În procesul de calcul al valorilor us și î>s prin algoritmul de multiplicare Schönhage-Strassen după scalarea în ( ), devine clar că toate numerele complexe A^ calculate în timpul execuției trecerii j a subrutina de transformare va fi mai mică de ¥ în valoare absolută ~to Arătați că atunci când se efectuează a treia transformată Fourier (calcularea wT), toate valorile vor fi mai mici de în valoare absolută ► [M ] Câte automate trebuie să existe în configurația iterativă liniară definită de ( ) și ( ) pentru ca o valoare fixă a lui n să poată calcula produsul numerelor de n biți? (Rețineți că automatul Mj este afectat doar de componenta Zq a mașinii din dreapta, așa că putem elimina toate automatele a căror componentă este întotdeauna zero pentru orice numere de n biți ) ► [MJJ] (A Schonhage) Scopul acestui exercițiu este de a demonstra că o formă simplă a unei mașini cu un indicator (punct de separare) poate efectua înmulțirea numerelor de n biți în pași O(n) Aparatul nu are capabilități aritmetice încorporate; tot ce face este să lucreze cu pointeri și noduri Fiecare nod are același număr finit de câmpuri de legătură și există un set finit de registre de legătură Operațiunile pe care această mașină le poate efectua sunt enumerate mai jos: i) citirea unui bit de intrare; dacă acest bit este , atunci executați tranziția; ii) ieșire sau ; iii) încărcarea în registru a conținutului altui registru sau a conținutului câmpului de legătură al nodului indicat de registru; iv) stocarea conținutului registrului în câmpurile de legătură ale nodului indicat de registru; v) filială în caz de egalitate a două registre; vi) crearea unui nou nod și formarea unui pointer către acesta în registru; viii) oprirea procesului Implementați eficient o metodă de transformare Fourier pe o astfel de mașină [Indicaţie Arătați mai întâi că pentru orice N pozitiv este posibil să se creeze N noduri reprezentând numerele întregi { , , N - }, unde nodurile care reprezintă numerele p au pointeri către nodurile care reprezintă numerele p + , [p/ ] și p Astfel de noduri pot fi create în pași O(N") Arătați că aritmetica de bază N poate fi modelată cu ușurință în acest caz De exemplu, pentru a găsi un nod pentru (p+q) mod N și a determina dacă p+q > N sunt pointeri pe p și q, o astfel de aritmetică ar necesita O(log N) pași De asemenea, operația de înmulțire poate fi modelată în O(log N') pași Acum luați în considerare algoritmul dat în textul secțiunii, cu k = I, m = k n N = ^m?/ ^, astfel încât toate valorile pentru aritmetica în punct fix sunt reprezentate ca numere întregi de biți în baza N Astfel, arătați că fiecare trecere a transformării rapide Fourier poate fi implementat în pași O(K + (A og:V) ) = O(K) folosind următoarea idee: Fiecare dintre K operațiunile de atribuire necesare poate fi "compilată" pentru un computer simulat precum MIX ca o listă limitată de instrucțiuni , dimensiunea cuvântului mașină este N, iar comenzile pentru K mașini care efectuează operații în paralel pot fi modelate în O(K+(Nlog N) ) pași, cu condiția ca comenzile să fie sortate în așa fel încât toate comenzile identice să fie executate împreună (Două instrucțiuni sunt identice dacă au același cod, același conținut al registrelor și operanzii sunt localizați în aceleași locații de memorie ) Rețineți că N = O(n '/ ) și, prin urmare, (NlogN) = O(K) ] [M ] (A Schönhage ) Pe baza rezultatelor acestei secțiuni pentru m = n, obțineți o estimare superioară bună pentru timpul necesar pentru a înmulți un număr de m biți cu un număr de n biți în cazul în care ambele numere sunt foarte mare, dar n este mult mai mare decât m [MJ ] Scrieți un program de implementare a algoritmului T, ținând cont de cele realizate în exercițiu îmbunătățiri Comparați-l cu programul dezvoltat pentru algoritmul M și cu programul bazat pe utilizarea lui ( ) pentru a vedea cât de mare trebuie să fie numărul n pentru ca îmbunătățirea algoritmului T să se manifeste [Af^P] (S A Cook (S A Sook) ) Un algoritm de multiplicare se numește algoritm în timp real dacă bitul de intrare (fc + l)-ro al operandului este efectuat numai după calculul k- bitul de ieșire Care sunt cei mai rapizi algoritmi de multiplicare în timp real care pot fi implementați pe diverse mașini? [ ] Demonstrați că transformata Fourier discretă din ( ) necesită numai operații aritmetice O(KlogK), chiar dacă K nu este o putere a lui [Sugestie Rescrie expresia ( ) ca - -s / (s-N) / - / Noi = W ' U UT ' W ' ut o "Rezolvați" această ecuație recursivă găsind formula exactă pentru Kn când n = e* + er Ch-+ e", ei > er > • • • > > [MLO] Dezvoltați o schemă de alocare a memoriei pentru rezultate intermediare la efectuarea operațiilor de înmulțire conform unui algoritm recursiv bazat pe ecuația ( ) Având în vedere două numere întregi de A-bit u și ѵ, fiecare dintre acestea ocupând N biți de memorie Arătați cum să constrângeți calculul astfel încât produsul uv să fie în ultimii N biți semnificativi din zona de biți ( A + O(log A)) a spațiului de lucru [M ] Arată cum se calculează uv mod m cu un număr limitat de operații specificate în regulile ex - dacă este posibil să se verifice dacă un operand este mai mic decât celălalt Ambele numere u și v sunt variabile, dar m este constantă Instruire Luați în considerare problema de descompunere în ( ) CONVERSIE DE LA UN SISTEM DE NUMERE ÎN ALTUL Dacă voi dintre strămoșii noștri, când inventați aritmetica, ați număra cu două mâini sau cu opt degete, și nu cu zece "cifre", nu am fi avut niciodată probleme să dezvoltăm programe de conversie binară în zecimală a numerelor (Și poate că nu am fi învățat niciodată atât de multe despre sistemele numerice ) Această secțiune va acoperi problemele implicate în conversia numerelor dintr-un sistem de numere pozițional într-un sistem de numere pozițional într-o altă bază Desigur, acest proces este cel mai important pentru computerele binare atunci când convertesc datele de intrare prezentate în format zecimal în format binar și conversia rezultatelor din format binar înapoi în zecimal A Patru metode principale Conversia numerelor din binar în zecimal și invers este una dintre operațiunile cele mai dependente de mașină, deoarece designerii de computere trebuie să inventeze în mod constant diferite moduri de a implementa această operație în hardware În acest sens, vor fi luate în considerare mai jos doar principiile de bază pentru rezolvarea acestei probleme, pe baza cărora programatorii pot alege procedurile care sunt cele mai potrivite pentru implementarea unei anumite configurații pe un computer Vom presupune că operațiile de transformare sunt efectuate numai cu numere nenegative, deoarece manipularea semnelor este ușor de luat în considerare Să presupunem că faceți conversia de la baza b la baza B (Generalizarea pentru sistemele de numere cu baze mixte este tratată în exercițiile și ) Majoritatea procedurilor de conversie de la bază la bază se bazează pe înmulțire și împărțire, folosind una dintre cele patru metode descris mai jos Primele două metode sunt folosite pentru a converti numere întregi (punctul de separare este în dreapta), iar celelalte două sunt folosite pentru părți fracționale ale numerelor (punctul de separare este în stânga) Cel mai adesea, este imposibil de exprimat cu acuratețe partea fracțională finală în baza b (O u iu u~m)b ca parte fracțională finală în baza B (OU- U- ■ ■ ■ U m)b- Pentru exemplu, o fracție zecimală în format binar reprezentată ca o fracție infinită ( , ) În acest sens, uneori este necesar să rotunjiți rezultatul la M cifre Metoda a (împărțirea cu B folosind reprezentarea numerelor în baza b) Pentru un întreg dat și puteți obține o reprezentare de bază B de forma ( UșUiUo^b făcând t o=wmodB, Ui = [u/BJ mod B, Uș = \\u/B\/B\ mod B, până la [ | [u/BJ /BJ /BJ = Metoda , b (Înmulțirea cu B folosind reprezentarea numerelor în baza b) Dacă reprezentarea unui număr și în baza b are forma (um nіo)b, atunci folosind operații aritmetice cu numere care sunt prezentate în formatul în baza B, puteți obține un polinom u (( (um b + um i) b + ■■•)b + ui)b + u - Metoda , a (Înmulțirea cu b folosind reprezentarea numerelor de bază B) Pentru un număr fracționar dat și, puteți calcula valorile cifrelor ( U-iU- ■ ■ -) în reprezentarea sa de bază B, după cum urmează: D-! = D- = L{^}BJ, IL = L{{"WJ- unde {a:} înseamnă a: mod = x - [a?J Pentru a rotunji rezultatul la M cifre, calculul poate fi întrerupt după primirea U-th, iar dacă { {{uB} } B} este mai mare decât |, atunci valoarea U-th ar trebui crescut cu unu (Rețineți, totuși, că această operație poate duce la necesitatea efectuării translațiilor, care trebuie incluse în rezultat folosind operații aritmetice în baza B Ar fi mai ușor să adăugați constanta ^B~m la numărul original înainte de a începe calculul, dar acest lucru poate duce la un rezultat incorect dacă numărul ^B~m nu poate fi reprezentat exact în formatul din baza b în computer De asemenea, rețineți că este posibil să rotunjiți rezultatul la ( , ) în dacă bm > BM ) În ex Secțiunea consideră o generalizare a acestei metode la cazul unei variabile M suficient de mare pentru a reprezenta numărul inițial cu o precizie dată Într-o astfel de situație, problema transferului nu se pune Metoda , b (Diviziunea cu b folosind reprezentarea numerelor de bază B) Dacă numărul și este reprezentat în baza b sub forma (O u iu • ■ • atunci, folosind operații aritmetice în baza B, puteți calcula + u &~ + • ■ • + u mb~m în forma ((• • • (u m/b + u t)/N- - u^/b + u-ij/b Este necesar să se monitorizeze cu atenție erorile care apar la trunchierea sau rotunjirea în timpul operației de împărțire prin i>; Ei sunt de obicei mici, dar nu este întotdeauna cazul Să rezumam Metodele , a; , b: , a și , b oferă fiecare două moduri posibile de a converti numere întregi și fracționale Și, desigur, este posibil să convertiți numere întregi în fracții și invers prin înmulțirea sau împărțirea cu puterea corespunzătoare a lui b sau B Prin urmare, există cel puțin patru metode din care să alegeți pentru a efectua conversia B Conversie cu o singură precizie Pentru a ilustra aceste metode, să presupunem că MIX este un computer binar și doriți să convertiți un întreg nenegativ u, reprezentat în format binar, în format zecimal, adică obțineți b = și B = Metoda și puteți programa în felul următor ENT Atribuiți j - LDX și ENTA Atribuie GAH și H DIV \u d \u d (gA, rX) "- ([gAX / IO], rAX mod ) RĂSPUNS STX Uj "- gX ( ) INC j "- j + - SRAX gAH "- gA JXP B Repetați până când până când rezultatul este zero | Pentru a calcula M biți, este necesar să petreceți M -I- cicluri Metoda a folosește împărțirea cu Metoda a folosește înmulțirea cu , astfel încât programul care implementează această metodă poate rula puțin mai repede Dar folosind metoda a, trebuie să te ocupi de fracții, iar acest lucru duce la o situație interesantă Fie w dimensiunea unui cuvânt de mașină și fie u " ENT n- Atribuiți j n - MUL = = Să ne imaginăm că punctul de separare este în stânga, rA = x RĂSPUNS STA l Atribuiți Uj ( zJ SLAX x {Sud} DECI j j > ( ) Acest program este puțin mai lung decât cel anterior și durează n + cicluri pentru a se finaliza, deci pentru n - M > rulează mai repede decât programul ( ) Cu toate acestea, dacă există zerouri de început, programul ( ) va rula mai repede Programul ( ) în forma prezentată pentru m '", deoarece este necesar să se ia n = zn + În acest caz, cifra de început a numărului u poate fi obținut prin calcularea [ u / (tm)J; după aceea, puteți converti numărul și modul (tm) conform metodei de mai sus cu n \u d m Faptul că biții rezultatului pot fi obținuți de la stânga la dreapta poate fi util în unele aplicații (de exemplu, la ieșirea de biți secvențiali ai rezultatului de imprimat) Deci, metoda aplicabilă fracțiilor poate fi folosită și pentru a converti numere întregi, deși, folosind diviziunea inexactă în timpul conversiilor, va trebui să efectuați o analiză numerică a metodei În metoda , și împărțirea cu poate fi înlocuită cu două înmulțiri Acest lucru poate fi semnificativ, deoarece conversia de bază se face adesea pe computere "satelit" care nu au o rutină de diviziune încorporată Presupunând că x este o aproximare a astfel încât j > | Operația de înmulțire cu poate fi înlocuită cu operațiile de schimbare și adunare În ex are în vedere o metodă de transformare mai rapidă, eventual mai rapidă, în care, în loc de înmulțiri m - , se folosesc aproximativ înmulțiri, mascări și adunări Igm Pentru a converti în zecimale binare ( u iu u t)u, puteți folosi metoda ,b sau, mai general, mai întâi convertiți numărul întreg (u-ju- • •u~t)io folosind metoda de asemenea, și apoi împărțiți rezultatul la t C Calcule manuale Uneori, în procesul de programare, devine necesar să se efectueze conversia numerelor manual și, deoarece acest lucru nu este încă predat în școlile obișnuite, este logic să discutăm pe scurt această problemă aici Sunt cunoscute metode manuale simple de conversie a numerelor din zecimal în octal și invers; aceste metode sunt ușor de învățat, așa că ar trebui să devină cunoscute pe scară largă Convertiți numere întregi din octal în zecimal Cea mai simplă este conversia de la octal la zecimal Această metodă pare să fi fost publicată pentru prima dată de Walter Soden în Math Comp ( ), - Pentru a efectua conversia, trebuie să scrieți numărul octal dat, dublați cifrele inițiale fc la pasul fc, folosind aritmetica zecimală și scădeți rezultatul din cifrele de început (fc + ) folosind din nou aritmetica zecimală Dacă numărul dat conține (m+l) cifre, atunci procesul se oprește după m pași A fost o idee bună să introduceți un punct de separare pentru a evidenția cifrele duble, așa cum se arată în exemplul următor Acest lucru ajută la eliminarea posibilelor erori Exemplul Convertiți numărul ( ) în zecimală - , - , - - - - Rezultat: ( ) O modalitate destul de fiabilă de a verifica calculele este să "arunci nouă": suma cifrelor unui număr zecimal trebuie să fie congruentă modulo alternativ cu suma și diferența cifrelor numărului prezentat în format octal și cifra din dreapta al ultimului număr este luat cu semnul plus În exemplul de mai sus, avem + + + + + + = și - + - + - + = - ; diferența este de (un multiplu de ) Dacă testul eșuează, atunci se repetă cu (k + ) biți de început după pasul fc-ro și se determină locația erorii folosind o procedură de căutare binară Cu alte cuvinte, puteți determina unde a apărut eroarea pornind de la verificarea rezultatului mediu și apoi, în funcție de dacă rezultatul este corect, aplicați aceeași procedură la prima sau a doua parte a calculului Deoarece există o șansă de una din nouă ca două numere întregi aleatorii să difere modulo nouă, fiabilitatea procedurii de aruncare a nouă este de numai % O modalitate mai fiabilă de verificare este să convertiți rezultatul înapoi în octal folosind metoda inversă, care va fi discutată într-un moment Convertiți numerele întregi reprezentate în format zecimal în format octal O procedură similară poate fi utilizată pentru a efectua transformarea inversă Scriem numărul dat în format zecimal, dublăm cifrele inițiale la pasul fc-a folosind reprezentarea octală și adăugăm cifrele inițiale rezultate (k + ), din nou folosind reprezentarea octală Pentru un număr dat care conține (m + ) cifre, procesul se termină în m pași Exemplul : Convertiți numărul ( ) în octal L + I + , + , + + + Rezultat: ( )s (Rețineți că cifrele non-octale și sunt prezente la calcularea reprezentării octale ) Verificarea rezultatului se poate face în modul descris mai sus Această metodă a fost publicată de Charles P Rozier, IEEE Trans SE- ( ), - Ambele proceduri descrise sunt, în esență, variații ale metodei , b ale conversiei generalizate de la un sistem numeric la altul Dublarea și scăderea în zecimală este ca și înmulțirea cu - = Dublarea și scăderea în octal este ca și înmulțirea cu + = Există o metodă similară pentru conversia de la hexazecimal la zecimal, dar această conversie este puțin mai complicată , deoarece în loc să înmulțim cu , implică înmulțirea cu Pentru a vă aminti ambele metode, trebuie să înțelegeți că atunci când convertiți un număr din octal în zecimal, se efectuează scăderea, deoarece reprezentarea numerelor în format zecimal este mai scurtă decât în octal În mod similar, atunci când convertiți un număr din zecimal în octal, trebuie efectuată adunarea Calculele sunt efectuate în formatul de reprezentare a rezultatului, nu în formatul original de reprezentare a numărului; în caz contrar, nu se va obține rezultatul dorit Conversia fracțiilor Nu sunt cunoscute metode similare potrivite pentru conversia manuală a fracțiilor la fel de rapid Metoda a pare a fi cea mai bună, care utilizează dublarea și adăugarea pentru a face înmulțirea cu sau mai ușoară În acest caz, criteriile de selectare a adunării și/sau scăderii sunt inversate - la conversia numerelor în format zecimal, se efectuează adunarea, iar la conversia numerelor în format octal, se efectuează scăderea În plus, calculul folosește formatul în care este prezentat numărul inițial, și nu formatul în care rezultatul este înlocuit (a se vedea exemplele și de mai jos) Implementarea acestui proces necesită aproximativ de două ori mai multe calcule decât metoda de conversie a întregului discutată mai sus Exemplul : Conversia unui număr ( )u în octal - - / - , - , - , - / Rezultat: ( •• Ze- Exemplul : conversia numărului { )" în zecimală + , + + , + , + , + Rezultat: ( ) D Conversie în virgulă mobilă Când efectuați conversii în virgulă mobilă, trebuie să efectuați simultan operații atât asupra părții întregi a numărului, cât și asupra părții fracționale, deoarece conversia părții întregi a numărului afectează partea fracțională Pentru a converti numărul f • e în format zecimal, puteți mai întâi să reprezentați e ca F • e (de obicei folosind tabele auxiliare) și apoi să convertiți Ff în format zecimal În mod similar, puteți înmulți e cu log și apoi rotunjiți rezultatul la cel mai apropiat număr întreg E; apoi împărțiți f • e la e și transformați rezultatul În schimb, pentru a converti al-lea număr F ■ e în binar, puteți converti F și apoi îl puteți înmulți cu numărul ii*- reprezentat în format virgulă mobilă (din nou folosind tabele auxiliare) Pentru a reduce dimensiunile maxime ale tabelelor auxiliare se folosește tehnica uzuală, bazată pe aplicarea mai multor înmulțiri și/sau împărțiri, deși aceasta poate duce la propagarea erorilor din cauza rotunjirii rezultatelor intermediare Problemele minimizării unor astfel de erori sunt luate în considerare în ex E Transformare cu precizie multiplă Cel mai convenabil este să începeți conversia numerelor foarte lungi prin conversia blocurilor de biți, operațiuni asupra cărora pot fi efectuate cu o singură precizie Apoi combinați aceste blocuri folosind metode simple care sunt specifice preciziei multiple De exemplu, să fie " cea mai mare putere, cu mai mică decât dimensiunea cuvântului mașinii Apoi: a) pentru a converti un întreg cu precizie multiplă din binar în zecimal, este necesar să îl înmulțiți cu " (conversia astfel din binar în zecimal cu baza " folosind metoda , a); folosind operații cu o singură precizie, obținem n zecimale pentru fiecare unitate de reprezentare din sistemul numeric cu bază "; b) pentru a converti partea fracționară a unui număr cu precizie multiplă din binar în zecimal, procedați într-un mod similar înmulțind-o cu " (adică folosind metoda , a, unde B = "); c) pentru a converti un întreg cu precizie multiplă din zecimal în binar, mai întâi convertiți blocuri de n biți; apoi, pentru a converti de la baza la binar, utilizați metoda , b; d) Pentru a converti o parte fracțională cu precizie multiplă din zecimal în binar, mai întâi convertiți la baza " ca în procedura (c), apoi utilizați metoda , b F Istorie şi bibliografie Tehnicile de conversie a numerelor dintr-un sistem numeric în altul erau folosite în antichitate în probleme legate de măsuri, greutăți și bani, când de obicei trebuia să te ocupi de sisteme de numere cu baze mixte Aceste transformări au fost de obicei efectuate folosind tabele auxiliare În secolul al XVII-lea, când fracțiile sexagesimale au fost înlocuite cu zecimale, a devenit necesară conversia de la un sistem numeric la altul pentru a putea folosi cărțile disponibile de tabele astronomice În , într-o carte editată de William Oughtred, Clavis Mathematica; (vezi cap , secțiunea ) a fost dată o metodă sistematică pentru conversia fracțiilor din baza în baza (Prima ediție a cărții lui Ogred din nu avea acest material ) Au fost formulate reguli pentru conversia de la un sistem numeric la altul de al-Kashi din Samarkand în lucrarea sa Key to Arithmetic ( ), care conturează clar metodele , a; b și a [Historical Mathematical Research ( ), - ], dar opera sa era necunoscută în Europa În secolul al XVIII-lea, matematicianul american Hugh Jones a introdus termenii "octavație" și "decimare" pentru a descrie regulile de conversie de la octal la zecimal, dar metodele sale s-au dovedit a fi la fel de obscure ca terminologia sa A M Legendre a observat că numerele întregi pozitive pot fi ușor convertite în binare prin împărțirea la din nou [Theorie des Nombres (Paris, ), ] În , G G Goldstein (N N Goldstine) și J von Neumann (J von Neumann) în lucrarea lor clasică Planning and Coding Problems for an Electronic Computing Instrument au oferit o analiză profundă a problemei conversiilor de la un sistem numeric la altul în legătură cu cu necesitatea de a justifica aplicabilitatea aritmeticii binare (Vezi John von Neumann, Collected Works (New York: Macmillan, ), - ) O altă lucrare timpurie privind conversia numerelor dintr-un sistem numeric în altul în calculatoare binare a fost publicată de F Koons) și S Lubkin în Matematică Comp ( ), - , unde au propus o metodă neobișnuită de transformări Ceva mai târziu, FL Bauer și K Samelson au publicat prima discuție despre problema conversiei în virgulă mobilă [Zeit fur angewandte Math und Physik ( ), - ] De interes istoric sunt și notele lui G T Lake [SDSM ( ), - ], care descriu metodele de implementare hardware a transformărilor și oferă exemple de înțeles, precum și articolul lui A X Strode (A N Stroud) și D Secretul [Comp J ( ), - ], care se ocupă de conversia numerelor date cu precizie multiplă Transformările numerelor în virgulă mobilă nenormalizate care păstrează "semnificația" corespunzătoare reprezentării au fost luate în considerare de G Kanner (N Kappeg) în JACM ( ), - și de N Metropolis și R L Eshenhurst ( RL Ashenhurst) în matematică Comp ( ), - (Vezi, de asemenea, K Sikdar, Sankhyă VZO ( ), - , și referințele din acestea ) F J Plauger în The Standard C Library (Prentice-Hall, ), - , oferă o descriere detaliată a întregului și flotant rutine I/O formatate punctual scrise în limbajul de programare C EXERCIȚII ► [ ] Generalizați metoda , b astfel încât să fie aplicabilă sistemelor de numere poziționale cu bază mixtă; transforma expresia att-i ■ ■ ■ bibo + • ■ ■ + aіbo -I- ao în AmBm-i ■ ■ ■ Bі-Bo + ■ • ■ + AiBo + Ao, unde - e, atunci răspunsul corect este U = ) [M ] (a) Demonstrați că orice număr real cu o reprezentare binară finită are și o reprezentare zecimală finită (b) Găsiți o relație simplă între numerele pozitive și B care oferă condiții necesare și suficiente pentru ca orice număr real care are o reprezentare finită în formă b să aibă și o reprezentare finită în formă b [M ] Arătați că programul ( ) va fi executat dacă comanda LDX " n" este înlocuită cu comanda LDX "c" pentru anumite valori ale constantei c pO] Explorați metodele a; , b; a și b pentru cazul în care sau B este - [MI ] Se știe că și luați în considerare procesul de calcul [±]ir+ vmodl ,r M(n) [MJ ] Este posibil să se reducă semnificativ limita superioară a timpului de execuție a conversiei întregi mari date în exercițiu ? (Vezi exercițiul - ) [ ] Construiți o configurație iterativă liniară rapidă pentru conversia numerelor din zecimal în binar (vezi Secțiunea E) [MjO] Dezvoltați rutine de conversie în virgulă mobilă "ideale" care convertesc numere zecimale cu p cifre în numere binare cu p cifre și invers, producând în ambele cazuri rezultatul rotunjit corect în termenii Secțiunii [BM J] (David W Matula) baza b în sensul secțiunii Presupunând că logul în b este irațional și că partea întreagă aparține unui interval infinit, dovediți că u = goip,(goip(u, P),p) pentru toate numerele p-biți și în virgulă mobilă reprezentate în baza dacă și numai dacă Bp~ > bp (Cu alte cuvinte, o transformare "perfectă" de intrare a unui număr arbitrar u într-o reprezentare în baza independentă B și o transformare "perfectă" de ieșire a acestui rezultat după ce va da întotdeauna un număr din nou și dacă și numai dacă precizia intermediară P este suficient de mare, așa cum este definit de formula de mai sus ) [MSZ] Să presupunem că numărul zecimal u = (u? • • • uiuo)io este reprezentat ca un număr zecimal codat binar U = (u? ■ ■ ■ uiuo)i - Aflați constantele corespunzătoare ci și maștile tw , cum ar fi că operația U Numărul zero este reprezentat ca ( / ) În această reprezentare (u/w') = (v/v') dacă și numai dacă u = v și u' = v' Înmulțirea fracțiilor este ușor Pentru a găsi (u/u') x (v/v') - (w/w'), se poate calcula pur și simplu uv și u'v' Două produse uv și u'v' pot să nu fie coprime, dar dacă notăm d = gcd(wr, u'v'')*, atunci rezultatul dorit va fi egal cu w = uv/d, w' = u' v'/ d (vezi exercițiul ) Secțiunea discută un algoritm eficient pentru calcularea celui mai mare divizor comun Fracțiile pot fi înmulțite într-un alt mod, și anume găsirea valorilor di = gcd(u, r') și d - gcd(u', v); atunci rezultatul este w = (u/di)(v/di), w' = (u'/di)(v'/di) (vezi exercițiul ) La înmulțirea fracțiilor cu această metodă, este necesar să se calculeze cei mai mari divizori comuni, dar, în realitate, calculele folosind această metodă nu durează mai mult decât folosind primul În procesul de găsire a celui mai mare divizor comun, se efectuează o serie de iterații, al căror număr este de fapt proporțional cu logaritmul numerelor de intrare, astfel încât numărul de iterații necesare pentru a obține numerele di și d este în esență egal la numărul de iterații necesare pentru a calcula un singur număr d Mai mult, fiecare iterație în determinarea di și d pare a fi mai rapidă, deoarece sunt luate în considerare numere relativ mici Dacă u, u', v și v' sunt mărimi cu precizie simplă, atunci această metodă are un avantaj față de prima, deoarece, dacă este posibil să se reprezinte numerele w și w' doar cu precizie simplă, numerele cu precizie dublă nu sunt implicate deloc în calcule precizia Împărțirea se poate face în mod similar (vezi exercițiul ) Adunarea și scăderea fracțiilor este puțin mai complicată Procedura obișnuită este de a lua (u/u') ± (y/v') - ((uv' ± u'v)/u'v '), și apoi reduceți fracția dată la o formă ireductibilă În acest caz, ca și în prima metodă, se folosește cel mai mare divizor comun d = gcd(uv' ± u'v, u'v') Dar, din nou, se poate evita să se ocupe de numere atât de mari, începând cu di = gcd(u', v') Pentru di = , dividendul și divizorul necesar sunt w = uѵ' ± u'v și w' = u'v' (Acest caz trebuie subliniat, deoarece conform teoremei D, dacă numitorii u' și v' sunt distribuiți aleatoriu, atunci di este egal cu în aproximativ de cazuri * Aici și mai jos, gcd() înseamnă cel mai mare devizor comun - Notă, trad din Dacă di > , atunci setăm t = u(y'/di) ± v(u'/di) şi calculăm d = gcd(t,di); rezultatul final este w = t/d , w' = (u'/di)(v'/d )- (Exercițiul demonstrează că aceste valori ale lui w și w' sunt coprime ) precizia se realizează și cu unică precizie, dar t poate fi un număr de precizie dublă sau puțin mai mult (vezi exercițiul ); dat fiind că gcd(t, di) = gcd(tmodd , di), calculul lui d nu necesită precizie dublă De exemplu, pentru a calcula ( / ) + ( / ), găsim di = mcd( , ) = ; atunci t = • + • = și d = mcd( , ) = , deci obținem Rutinele de verificare care implementează operații aritmetice pe numere raționale pot fi efectuate folosind inversarea matricei cu o matrice inversă cunoscută (cum ar fi matricele Cauchy; exercițiul - ) Experiența calculelor cu fracții arată că în procesul de efectuare a operațiilor, numerele devin în multe cazuri foarte mari Prin urmare, dacă ambele și și pentru fiecare fracție (și/și) sunt considerate a fi numere cu o singură precizie, este foarte important ca verificările de depășire să fie incluse în fiecare rutină de adunare, scădere, înmulțire și împărțire La rezolvarea problemelor cu numere pentru care este importantă precizia ridicată, un set de subprograme pentru efectuarea de operații aritmetice pe fracții cu precizie arbitrară acceptabilă este foarte util Metodele discutate în această secțiune se aplică și altor câmpuri numerice, în special, se pot efectua operații aritmetice pe valori de forma (u + u'\/ )/u", unde u, u' și" sunt numere întregi, mcd(u, u', u") = și u" > , sau peste cantități de forma (u - u'^ + u" ^ )/u"' etc De asemenea, este interesant de luat în considerare (dacă nu persisti în aplicarea metodelor exacte) numerele în format de fracție fixă, și în format de fracție flotantă, care sunt analoge ale numerelor în virgulă mobilă, dar se bazează pe fracții raționale, și nu pe fracții concentrate pe reprezentare în sisteme numerice cu o bază fe* Când se reprezintă o fracție în format binar cu o bară oblică fixă, numărătorul și numitorul fracției nu conțin mai mult de p biți, unde p este un număr întreg dat În cazul unei reprezentări de fracții în formatul de fracții flotante, suma biților pentru numărător și numitor nu depășește un anumit q\ dat, în timp ce un alt câmp de reprezentare este utilizat pentru a determina dimensiunea numărătorului ca parte integrantă a lanț de q biți Infinitul poate fi reprezentat ca ( / ) Pentru a efectua aritmetica pe astfel de numere, introducem definiția x (r) y = rotund(a; + y), x - y = rotund(a; - y), etc , unde rotund(a;) = x dacă x este imaginabil În caz contrar, unul dintre numerele reprezentabile din vecinătatea numărului x este ales ca x La prima vedere, ar putea părea că cel mai bun mod de a defini rotunjirea(a;) este să alegeți numărul reprezentabil cel mai apropiat de x, similar cu alegerea rotunjirii în aritmetica în virgulă mobilă Dar practică * Termenii "slash fix", "floating slash" și "slash-arithmetic" sunt folosiți în original, pe care, din cauza lipsei unor termeni relevanți bine stabiliți în literatura de limbă rusă, îi vom traduce prin "format cu o bară oblică fixă", "format cu o bară oblică plutitoare", "aritmetică în format bară oblică" și "numere în format oblică oblică "- Aproximativ, trad a arătat că cel mai bine este să urmăriți alegerea rotunjirii sub formă de numere "prime", deoarece numerele cu numărători și numitori mici sunt mult mai comune decât fracțiile complexe Este de preferat să rotunjiți numerele până la | mai des decât înainte ||| În acest caz, regula de rotunjire, care se dovedește a fi cea mai reușită din punct de vedere practic, se numește "rotunjire mediană" și este formulată după cum urmează Dacă (u/u') și (v/v') sunt numere reprezentabile învecinate, astfel încât pentru orice u/u' - ( ) u' și' + v' ѵ u' + v' Dacă egalitățile = (u+v)/(u'+v') sunt exact satisfăcute, presupunem că rotunjirea(a;) este egală cu cea mai apropiată fracție cu cel mai mic numitor (sau, dacă u' = ѵ', cu cel mai mic numărător) În ex - arată cum se utilizează rotunjirea mediană destul de simplu De exemplu, să presupunem că aritmetica este efectuată pe numere reprezentate în format bară oblică fixă cu p - , astfel încât pentru numere reprezentabile (u/t?) se are - Explicați cum să împărțiți două astfel de fracții și cum să obțineți câtul în aceeași formă [M ] Care este numărul maxim reprezentat în format zecimal flotant dacă lungimea numărătorului său este limitată la q și este dată lungimea numitorului? Ce numere sunt rotunjite la ( / )? [ ] (Matula și Kornerup ) Luați în considerare reprezentarea barei oblice plutitoare a unui cuvânt de de biți [M ] Explicați cum se calculează numărul exact de perechi de numere întregi (u, u') astfel încât Mi ; ( ) pentru w > ; ( ) pentru u,v > ; (YU) (ȘI) ( ) Ultimele două egalități sunt analoge ale "legii distribuției" și ѵ + uw = u(v + w) Relația ( ) reduce calculul mcd(u, r) la calculul lcm(u, u) și invers algoritmul lui Euclid Deși relația ( ) este foarte interesantă din punct de vedere teoretic, ea este inutilă pentru calculul practic al celui mai mare divizor comun, deoarece aceasta necesită mai întâi să se constate descompunerea numerelor u și ѵ în factori primi În prezent, nu există modalități cunoscute de a găsi foarte rapid factorii primi pentru numere întregi (vezi Secțiunea ) Din fericire, cel mai mare divizor comun a două numere întregi poate fi găsit eficient fără factorizarea numerelor în factori primi O astfel de metodă a fost descoperită cu peste de ani în urmă - algoritmul Euclid, care a fost deja discutat în detaliu în secțiunile și Algoritmul lui Euclid se găsește în cartea din Elementele sale (c î Hr ), propozițiile și , dar probabil că nu a fost inventat de Euclid Unii savanți sugerează că această metodă era cunoscută cu de ani mai devreme, cel puțin într-o formă subtractivă, și este aproape sigur că acest algoritm era cunoscut lui Eudoxus (c î Hr ); vezi K von Fritz, App Matematică ( ) ( ), - Aristotel (c î Hr ) este menționat în această carte în legătură cu subiectul luat în considerare, b, - Cu toate acestea, există foarte puține dovezi ale unei astfel de istorii timpurii a acestui algoritm [cf WR Knorr, The Evolution of the Euclidean Elemente (Dordrecht, )] Algoritmul lui Euclid poate fi numit bunicul tuturor algoritmilor, deoarece este cel mai vechi dintre toți algoritmii non-triviali care au supraviețuit până în prezent (Această onoare ar putea fi contestată de metoda egipteană antică de înmulțire, care se bazează pe metoda dublării și adunării și pe care se bazează metoda eficientă de calcul a n-a puteri, luată în considerare în secțiunea Dar egipteanul papirusurile dau pur și simplu exemple care nu au o natură sistematică completă, iar aceste exemple, în orice caz, nu sunt prezentate sistematic Prin urmare, metoda egipteană nu merită chiar numele de "algoritm" Există, de asemenea, câteva metode babiloniene antice folosite pentru aceasta tip de problemă, cum ar fi rezolvarea sistemelor speciale de ecuații pătratice în două necunoscute Aceștia sunt algoritmi reali, nu doar soluții parțiale de ecuații pentru parametrii de intrare anumiți Deși babilonienii au însoțit în mod constant expunerea fiecărei metode cu un exemplu pentru anumite valori a parametrilor de intrare, ei au oferit în mod regulat o explicație a procedurii de bază în textul însoțitor [Vezi D E Knuth, CACM ( ), - ; ( ), ] Mulți dintre acești algoritmi erau cunoscuți cu de ani înainte de Euclid și sunt cei mai vechi algoritmi înregistrati Cu toate acestea, ei nu rezistă comparației cu algoritmul lui Euclid deoarece le lipsesc iterații De aceea au fost înlocuite de metodele algebrice moderne ) Având în vedere importanța algoritmului lui Euclid, atât din punct de vedere istoric, cât și teoretic, să ne uităm la modul în care Euclid însuși l-a interpretat Parafrazându-l pe Euclid și folosind terminologia modernă, putem spune că el a scris ceva de genul următor Oferi Având în vedere două numere întregi pozitive, găsiți cel mai mare divizor comun al acestora Fie A și C două numere întregi pozitive date; trebuie să găsiți cel mai mare divizor comun al lor Dacă A este divizibil cu C, atunci C este un divizor comun al lui C și A deoarece se împarte singur Și este evident că va fi și cel mai mare divizor, deoarece nu există un număr mai mare decât numărul C care ar împărți C Dar dacă C nu împarte numărul A, atunci îl vom scădea continuu pe cel mai mic din numerele A, C din cel mai mare până când obținem un număr care împarte complet scăderea anterioară Acest lucru trebuie să se întâmple mai devreme sau mai târziu, pentru că dacă diferența este egală cu unu, atunci unitatea va împărți subtrahendul precedent Să presupunem acum că E este restul pozitiv al lui A împărțit la C; fie F restul pozitiv al lui C împărțit la E și fie F împarte E Deoarece F împarte E și E împarte C - F, F împarte și C - F Dar se împarte și pe sine, deci F împarte C și C împarte A - E; deci F împarte și A - E, dar împarte și E-, deci F împarte A Prin urmare, F este un divizor comun al numerelor A și C Acum susțin că este și cel mai mare divizor Într-adevăr, dacă F nu este cel mai mare divizor comun al numerelor A și C, atunci există un număr mai mare care va împărți ambele numere Fie acest număr G Deoarece numărul G împarte numărul C, iar numărul C împarte A - E, atunci G împarte și numărul A - E Numărul G împarte tot numărul A, deci împarte restul lui E Dar E împarte C - F, deci G împarte și C - F Și numărul G împarte tot numărul C, astfel încât împarte p restul lui F; astfel, un număr mai mare împarte pe unul mai mic, ceea ce este imposibil Astfel, nu există un număr mai mare decât F care să împartă A și C; deci numărul F este cel mai mare divizor comun Consecinţă Acest argument face evidentă propoziția că orice număr care împarte două numere împarte și cel mai mare divizor comun al acestora C T D Formularea lui Euclid este simplificată aici într-un aspect important Matematicienii greci nu au considerat unul ca fiind un "divizor" al altui număr pozitiv Două numere întregi pozitive erau fie ambele egale cu unu, coprim, fie aveau cel mai mare divizor comun De fapt, unul nici măcar nu era considerat un număr, iar zero, desigur, nu exista deloc Aceste convenții destul de incomode au fost motivul pentru care Euclid a trebuit să dubleze o mare parte din raționamentul său și a dat două propoziții separate, fiecare în esență similară cu cea de mai sus În demonstrația sa, Euclid propune pentru prima dată să scadă în mod repetat, pentru fiecare pereche de valori curente, numărul mai mic din cel mai mare, până în Rezultatul sunt două numere, dintre care unul este multiplu al celuilalt Dar atunci când demonstrează, el ia de fapt restul împărțirii unui număr cu altul și, deoarece conceptul de zero a fost absent, nu poate vorbi despre restul când un număr împarte altul Prin urmare, este rezonabil să spunem că el consideră fiecare împărțire (și nu fiecare scădere separat) ca un pas al algoritmului și, prin urmare, prezentarea "autentică" a algoritmului său este următoarea Algoritmul E (algoritmul original al lui Euclid) Având în vedere două numere întregi A și C mai mari decât unul, acest algoritm găsește cel mai mare divizor comun al lor E [A este divizibil cu C?] Dacă C împarte A, atunci algoritmul se termină, dând numărul C ca rezultat E [Înlocuiește A cu restul ] Dacă A mod C este egal cu unu, atunci numerele date sunt coprime, deci algoritmul se termină În caz contrar, înlocuiți perechea de valori (A, C) cu perechea (C, A mod C) și reveniți la pasul E | "Dovada" lui Euclid de mai sus prezintă un interes deosebit pentru că nu este deloc o dovadă! Euclid verifică rezultatul algoritmului numai atunci când pasul E este executat fie o dată, fie de trei ori Cu siguranță trebuie să fi înțeles că pasul E ar putea fi efectuat de mai mult de trei ori, deși nu menționează o astfel de posibilitate Neavând nicio idee despre demonstrația prin inducție matematică, el putea să dea dovadă doar pentru un număr finit de cazuri (De fapt, când a vrut să demonstreze teorema pentru cazul general n, a luat în considerare doar cazul special n = ) Deși algoritmul lui Euclid este cunoscut pe bună dreptate pentru marea sa contribuție la arta deducției logice, trucurile folosite în riguros dovezile prin inducție nu au fost descoperite decât multe secole mai târziu, iar ideile cheie folosite pentru a demonstra validitatea algoritmilor devin abia acum cu adevărat înțelese (O dovadă completă a algoritmului lui Euclid, precum și o scurtă discuție a procedurii de bază pentru demonstrarea algoritmilor, sunt date în Secțiunea ) Trebuie remarcat faptul că acest algoritm pentru găsirea celui mai mare divizor comun a fost ales de Euclid ca prim pas în expunerea sa a teoriei numerelor Și astăzi, multe manuale folosesc încă aceeași ordine de prezentare Euclid a dat şi o metodă (Propoziţia ) pentru găsirea celui mai mic multiplu comun al două numere întregi u şi v, şi anume: împărţiţi u la mcd(u, v) şi apoi înmulţiţi rezultatul cu r; aceasta este echivalentă cu relația ( ) Dacă ignorăm prejudecata lui Euclid față de numerele și , atunci algoritmul E poate fi reformulat după cum urmează Algoritmul A (Algoritmul lui Euclid în ediția modernă) Având în vedere numerele întregi nenegative ii, acest algoritm găsește cel mai mare divizor comun al lor (Notă Cel mai mare divizor comun al numerelor întregi arbitrare u și ѵ poate fi obținut folosind relațiile ( ) și ( ) prin aplicarea algoritmului la |u| și |v| ) Al [u = ?] Dacă ѵ = , atunci execuția algoritmului se termină, iar numărul u este returnat ca rezultat A [Luați atât mod și ] Atribuiți r ) ] Dacă t > , atunci atribuiți u +- t, în caz contrar atribuiți v +- - t (Cel mai mare dintre numerele u și ѵ este înlocuit cu |i| cu excepția, probabil, prima dată când acest pas este executat ) LA [Scădere ] Atribuiți t , atribuiți u ѵ > , atunci se poate scrie întotdeauna u = qv ± r, unde Generalizări Metodele folosite pentru a calcula gcd(u,v) pot fi generalizate pentru a rezolva probleme ceva mai complexe De exemplu, să presupunem că doriți să calculați cel mai mare divizor comun al n numere întregi u, u, , un O modalitate de a calcula mcd(ui,U , ,un), presupunând că toate Uj sunt nenegative, este de a generaliza algoritmul lui Euclid după cum urmează: dacă toate Uj sunt zero, atunci cel mai mare divizor comun este zero, în caz contrar, dacă există este doar un număr diferit de zero Uj, acest număr va fi cel mai mare divizor comun; în caz contrar, înlocuiți și* pe mod Uj pentru toate k > j, unde Uj este minimul numerelor diferite de zero u și repetăm procesul Algoritmul prezentat aici este o generalizare naturală a algoritmului lui Euclid Se poate justifica într-un mod similar Dar există o metodă mai simplă bazată pe identitatea ușor verificabilă gcd(ui,u , -,Un) = gcd(ui,gcd(u , •••,""))• ( ) Pentru a calcula gcd(ui, u , , un), se poate toci astfel Algoritmul C (cel mai mare divizor comun al n numere întregi) Având în vedere numerele întregi u, u , , un, unde n > , acest algoritm calculează cel mai mare divizor comun al lor, folosind algoritmul pentru cazul n = ca subrutină C Atribuiți d , atunci atribuiți d l Întrucât suma + + • • • = este egală cu r / conform formulei -( ), pentru ca relația anterioară să se țină, este necesar ca p = /r | Algoritmul lui Euclid poate fi generalizat într-un alt mod de mare importanță Se pot calcula numere întregi u' și ѵ' astfel încât u' + ѵv' = mcd(u, v) ( ) Simultan, se calculează și gcd(u, r) Această generalizare a algoritmului lui Euclid este descrisă convenabil folosind notația vectorială Algoritmul X (Algoritmul generalizat al lui Euclid) Pentru numerele întregi nenegative u și ѵ date, acest algoritm determină un vector (ui,u?,iz) astfel încât ux +VU = out = gcd(u,v) În procesul de calcul, se folosesc vectori auxiliari (u, V , V ), (ііДаДз); acţiunile cu vectori se realizează în aşa fel încât pe parcursul întregului proces de calcul relaţiile Uti+vt =t , UUi+VU =U , UV +VV = V - ( ) XI [Setare inițială ] Atribuiți (ui, U , u ) z = ?] Dacă ѵz = , atunci execuția algoritmului se termină HZ [Împărțire și scădere ] Atribuiți q [U /V J , apoi atribuiți (ii, t , t ) Dacă c = , atunci folosim această ecuație pentru a elimina variabila xo din ecuațiile rămase ale sistemului Apoi repetam aceeasi procedura cu privire la ecuatiile ramase ale sistemului (Dacă nu mai există ecuații, atunci calculele se opresc și, în esență, obținem soluția generală exprimată în termenii variabilelor rămase ) Dacă c > și dacă Ci mod c = • • • = c* mod c = , atunci verificăm d mod c = ; altfel nu există soluții întregi Apoi împărțim ambele părți ale ecuației ( ) la c și excludem x în același mod ca și în cazul c = Ca rezultat, dacă c > și nu toate ci mod c, , Ck mod c sunt egale cu zero, introduceți o nouă variabilă [c/cjxo + Lci/cjxi + ■ • • + [,c*/c)d:* = i, ( ) excludem variabila xq din alte ecuații folosind і și înlocuim ecuația inițială ( ) cu ecuația ci + (ci modc)xi + ■■• + (ck modc)xk = d ( ) (Sm ( ) și ( ) în exemplul de mai sus ) Acest proces trebuie finalizat, deoarece, în urma fiecărei etape, fie numărul de ecuații ale sistemului scade, fie valoarea celui mai mic coeficient diferit de zero al sistemului Dacă procedura descrisă este aplicată ecuației u + ѵy = pentru diferite numere întregi u și ѵ, atunci, în esență, se vor efectua pașii algoritmului X Procedura de transformare a variabilelor luate în considerare este un mijloc simplu și destul de evident de rezolvare a sistemelor de ecuații liniare cu coeficienți întregi, dar în niciun caz cea mai bună metodă pentru rezolvarea unei astfel de probleme Există modificări semnificative ale metodei, dar acestea depășesc scopul acestei cărți [Cm Henri Cohen, A Course in Computațional Algebraic Number Theory (New York: Springer, ), capitolul ] Este posibil să se utilizeze algoritmul lui Euclid cu numere întregi gaussiene și + ii', precum și cu alte câmpuri de numere pătratice (Vezi, de exemplu, A Hurwitz, Acta Math ( ), - ; E Kaltofen, H Rolletschek, Math Comp ( ), - ; A Knopfmacher, J Knopfmacher , BIT ( ), - ) Calcul cu mare precizie Dacă u și ѵ sunt numere întregi foarte mari care necesită o reprezentare cu precizie multiplă, atunci metoda binară (algoritmul B) este o metodă simplă și destul de eficientă pentru calcularea celui mai mare divizor comun al acestor numere, deoarece utilizează numai operații de scădere și deplasare în calcule Dimpotrivă, algoritmul lui Euclid pare a fi mult mai puțin atractiv, deoarece la pasul A este necesar să se împartă numărul u la numărul ѵ cu precizie multiplă Dar acesta nu este cu adevărat un obstacol în calea aplicării algoritmului lui Euclid, deoarece, așa cum va fi arătat în Secțiunea , coeficientul [u/u] este aproape întotdeauna foarte mic De exemplu, date intrări aleatorii, câtul [u/v\ va fi mai mic de aproximativ , % din timp Prin urmare, [u/uj și (u mod v) pot fi găsite aproape întotdeauna printr-un calcul cu o singură precizie combinat cu operația de calcul relativ simplă u-qv, unde q este un număr cu o singură precizie În plus, dacă se dovedește că și este mult mai mare decât ѵ (de exemplu, datele de intrare pot fi specificate în această formă), este dificil de imaginat că coeficientul q se poate dovedi a fi mare, deoarece algoritmul euclidian, dacă înlocuim și prin u mod și, în acest caz, cu succes O creștere semnificativă a vitezei de execuție a algoritmului Euclid atunci când se lucrează cu numere de înaltă precizie poate fi realizată folosind metoda propusă de D G Lehmer (D H Lehmer) [AMM ( ), - ] Operând numai cu cifrele inițiale ale numerelor mari, este posibil să se efectueze cea mai mare parte a calculelor cu o singură precizie, reducând astfel semnificativ numărul de operații care trebuie efectuate cu precizie multiplă Ideea este să economisești timp făcând calcule "virtuale" în loc de cele reale De exemplu, luați în considerare două numere de opt cifre u = și ѵ = , presupunând că avem un computer cu cuvinte din patru cifre Fie u' = , ѵ' = , u" - , ѵ" = ; atunci u'/v' și u'Чѵ" sunt aproximări la și/v și u'/v' o ( ) -uo + i>o uo - i>o u - i>o - u + Ui>o - u + Huo uo - i>o ? (Următorul coeficient este între și ) Indiferent de numărul de cifre ale numerelor și și v, atâta timp cât ( ) este valabil, primii cinci pași ai algoritmului lui Euclid vor fi aceleași ca în ( ) Prin urmare, calculele cu precizie unică pot fi efectuate în primii cinci pași, iar operațiile cu precizie multiplă pot fi efectuate numai la calcularea valorilor - uq + Pvo și uq - i>o În acest caz, obținem u = , v = ; calculele ulterioare pot fi continuate în mod similar cu numerele u' = , v = , u" = , v" = etc Cu un acumulator mai mare, ar fi posibil să se mărească numărul de trepte la care calculele sunt efectuate cu o singură precizie Din exemplu, se poate observa că doar cinci cicluri ale algoritmului Euclid sunt combinate într-un singur pas complex, iar dacă, să zicem, dimensiunea cuvântului era de zece cifre, până la douăsprezece cicluri ar putea fi combinate într-un singur pas Din rezultatele demonstrate în Secțiunea rezultă că, la fiecare iterație, numărul de bucle cu precizie multiplă care pot fi înlocuite cu bucle cu precizie unică este proporțional cu dimensiunea cuvântului utilizat în calculul cu precizie unică Metoda lui Lehmer poate fi formulată după cum urmează Algoritmul L (algoritmul lui Euclid pentru numere mari) Fie u și ѵ numere întregi nenegative cu precizie unică astfel încât u > ѵ Acest algoritm calculează cel mai mare divizor comun al numerelor u și v folosind variabile auxiliare p-bit d, v, A, B, C, D, T, q, care sunt reprezentate cu o precizie unică, și variabile auxiliare t și w, care sunt reprezentate cu precizie multiplă acuratețe L [Setare inițială ] Dacă numărul v este suficient de mic pentru a fi reprezentat într-un format de precizie unică, atunci gcd(u, v) este evaluat de algoritmul A și calculul se termină acolo În caz contrar, notăm cifrele principale ale lui u cu u și cifrele corespunzătoare ale lui v cu v Cu alte cuvinte, dacă se folosește reprezentarea numerelor în sistemul numeric de bază b, atunci d -[u/b*J și ѵ ⋅-[p/bfcJ, unde k este cel mai mic număr posibil care satisface condiția d = va fi valabilă, dar nu ambele în același timp Deci, încercarea de a împărți la zero în acest pas înseamnă "Mergeți direct la pasul L " ) L [Imitația algoritmului lui Euclid ] Atribuiți T H-A - qC, A W-S, S W-T, T h - V - qD, V h - D, D h - T, T W - qv, th h - ѵ, ѵ h- T și reveniți la pasul L (Aceste calcule cu o singură precizie sunt echivalente cu operațiile cu precizie multiplă din procedura ( ) cu ( ) luată în considerare ) L [Pasul la care sunt efectuate calculele cu precizie multiplă ] Dacă B = , atunci folosind diviziunea cu precizie multiplă, atribuiți t x- și mod v și h-v, vh-t (Acest lucru se poate întâmpla numai atunci când o operație cu o singură precizie nu poate modela o operație cu precizie multiplă Rezultă că algoritmul lui Euclid necesită un coeficient foarte mare, ceea ce se poate întâmpla foarte rar ) În caz contrar, atribuiți th lui Au, th - t + Bv, w h - Si, w h - w + Dv și h - t, ѵ h - w (efectuând operații direct cu precizie multiplă) Reveniți la pasul L | Luând în considerare inegalitățile ( ), în cursul calculelor, valorile lui A, B, C, D sunt prezentate cu o singură precizie Algoritmul L necesită un program puțin mai complex de implementat decât algoritmul B, dar atunci când funcționează pe numere mari, acest algoritm rulează mai rapid pe multe computere În mod similar, puteți accelera execuția algoritmului binar B în etapa finală (vezi exercițiul ) Avantajul algoritmului L este că determină succesiunea de coeficienti obținute prin rularea algoritmului Euclid, care este utilizat în numeroase aplicații (vezi, de exemplu, exercițiile , , , exercițiul din secțiunea și, de asemenea, exercițiu - ) •Analiza unui algoritm binar În încheierea acestei secțiuni, pentru a fundamenta formulele stabilite anterior, analizăm timpul de execuție al Algoritmului B Se dovedește că este extrem de dificil să descrii cu exactitate comportamentul algoritmului B, dar se poate începe analiza acestui algoritm de la modelul său aproximativ Să presupunem că numerele u și ѵ sunt impare, u > ѵ și [lguj=m, [lgwj=n ( ) (Astfel, u este un număr de biți (m + ) și ar este un număr de biți (n + ) ) și se oprește după finalizarea pasului B Fiecare ciclu de "scădere și deplasare" pentru u > ѵ calculează diferența u - ѵ și mută această valoare la dreapta până când se obține un număr impar u', care înlocuiește numărul u Dacă numerele de intrare sunt aleatorii, s-ar putea aștepta ca aproximativ jumătate din timp u' = (u - n)/ , aproximativ un sfert din timp u' = (u - n)/ , aproximativ o optime din timp u ' = (u - n)/ , aproximativ o optime din timp u' = (u - n)/ ") / etc Obținem [lg m'J - m - k - g, ( ) unde k este numărul de biți cu care numărul u - v a fost deplasat la dreapta și r este [lg uj - [lg (u - w)J - numărul de biți pierduți din stânga în timpul scăderii numărului v din numărul u Rețineți că r n + și r > pentru m = n Relația dintre k și r este destul de neregulată (vezi exercițiul ), dar Richard Brent a găsit o modalitate elegantă de a analiza comportamentul unui model aproximativ al algoritmului prin stabilirea u și ti suficient de mari astfel încât raportul v/u să aibă un continuu distribuție atunci când schimbarea la [Vezi Algoritmi și complexitate, editat de JF Traub (New York: Academic Press, ), - ] Să presupunem că u și v sunt numere întregi mari, posibil aleatoare, dar neapărat impare, iar raportul lor este supus unei anumite legi de distribuție Apoi, la pasul B , biții mai puțin semnificativi din t = și -v pot fi aleatori, dar t va fi par Prin urmare, t va fi un multiplu impar de k cu probabilitate ~k; este probabilitatea aproximativă ca k deplasările spre dreapta să fie efectuate în bucla "scădere și deplasare" Cu alte cuvinte, se obține o aproximare adecvată care descrie comportamentul algoritmului B în ipotezele făcute că trecerea de la pasul B la pasul B va avea loc întotdeauna cu probabilitate / Fie Cn(x) probabilitatea ca min(u, v)/max(u, w) să fie > x după ce n cicluri de "scădere și deplasare" sunt efectuate având în vedere aceste ipoteze Dacă u > v iar dacă se efectuează exact k deplasări la dreapta, atunci raportul X = v/u se schimbă în X' = min( fcw/(u - v), (u - v)/ kv) = mm( kX/( - X), ( - X) / kX) Astfel, inegalitatea X' > x va fi adevărată dacă și numai dacă kX/( - X) > x și ( - X)/ kX > x, care este același cu ( ) Prin urmare, Gn(x) satisface relația de recurență interesantă GwW-£ -*(Gn( ^-)-On(T L -)), ( ) unde G (x) - - x pentru Pe măsură ce x se schimbă de la la oo, (x) crește de la la Prin urmare, G(x) scade de la + la - Desigur, pentru x > , funcția G(x) încetează să mai fie o probabilitate; cu toate acestea, are sens (vezi exercițiul ) Să presupunem că există serii de puteri a(x), (x), m(a:), sm(x), A(x), g(m), cm(x), Tm(x) și p(g), astfel încât OO ( ) m=l oo ( ) m=l p(x) = G( + x) = P!X + P X + pzX + P T + P X + pex + • • • , ( ) Orez Distribuția limită a rapoartelor în algoritmul binar pentru calcularea celui mai mare divizor comun, întrucât se poate demonstra că pentru n > soluția Gn(i) a ecuației ( ) are această proprietate (vezi, de exemplu, Exercițiul ) Aceste serii de putere converg pentru |і| ( ) Din ( ) rezultă că A(x) este pur și simplu un multiplu constant al lui x; deoarece este negativ, putem scrie A(x) = -Ai ( ) (Coeficientul corespunzător ia forma A = , +, ( ) dar modul în care poate fi calculat este necunoscut ) Ecuația ( ) implică faptul că pi = -A și d* = kp,k - "lkpk pentru k > ; cu alte cuvinte, Pk \u d Pk / ( ~ -*) pentru k > ( ) Ecuația ( ) implică, de asemenea, că ambele serii de putere k= ( ) ( ) ( ) vezi ex Această formulă este surprinzător de similară cu expresia b -( ), obținută în legătură cu algoritmi de căutare discreti într-un arbore și în exercițiu este o dovadă a validității formulei = Ѳ(n~ ) Acum cunoaștem a(i), cu excepția cazului în care A = -pi este constantă Ecuația ( ) raportează funcțiile q(x) și p(t), excluzând coeficientul dr Din răspunsul la ex se poate observa că toți coeficienții funcției p(x) pot fi exprimați în termeni de pi, Ps, Pb, • • • • Mai mult, constantele am și rm pot fi calculate folosind metoda utilizată pentru rezolvarea problemei în ex ; în acest caz rămân relaţii complexe între coeficienţii funcţiilor m(i ) şi sm(x) Cu toate acestea, se pare că singura modalitate de a calcula toți coeficienții pentru diferitele funcții din expresia pentru G(x) este rezolvarea iterativă a ecuației recursive ( ) numeric După calcularea unei bune aproximări pentru G(x), putem estima timpul mediu de execuție al algoritmului B după cum urmează Dacă u > ѵ și dacă k se deplasează la dreapta, atunci cantitatea Y = uѵ va fi înlocuită cu Y' = (u - ѵ)v/ k Prin urmare, Y/Y' este egal cu * ( - LL), unde X = ѵ/ și este egal cu > x cu probabilitatea G(x) Rezultă că numărul de biți în uV scade în medie cu o constantă = Elg(y/y') = £ -*(A( ) + G(x)f'k(x)dx) unde fk(x) = lg( */(l I))- Se obține G(x) dx ( - i)ln G(x) dx ( - x) În ' ( ) Cu u = v, valoarea așteptată a lui Igwr va fi aproximativ egală cu , (vezi exercițiul ), astfel încât numărul total de cicluri de "scădere și deplasare" ale algoritmului B va fi aproximativ egal cu valoarea inițială a numărului lg și v , înmulțit cu /b Având în vedere proprietatea de simetrie, acest număr este aproximativ egal cu valoarea inițială a numărului Igw, înmulțită cu /b În urma calculelor efectuate în , Richard Brent (Richard Brent) a obţinut pentru această constantă fundamentală valoarea /b = , + ( ) Ca urmare a unei analize mai profunde a acestor funcții, Brigitte Vallee a sugerat că constantele A și b pot fi legate prin formula remarcabilă eu ( ) Despre G Valorile calculate de Brent sunt în acord cu această afirmație departe de a fi banală De mare interes este analiza algoritmului B, realizată cu succes de Valle pe baza unor metode "dinamice" riguroase [vezi Algorithmica ( ), - ] Să revenim la ipoteza din ( ) că u și v sunt impare și variază în intervalele m n, ( ) Da t + , p - , - , ( , )t"p, cu o abatere standard destul de mică de la mediile observate Cote | iar pentru m în expresiile ( ) poate fi verificat riguros (vezi Exercițiul ) Dacă presupunem că și v sunt orice numere întregi distribuite independent și uniform în intervale PI P ip(^)LnAJ - c) Ca un corolar al lui (b), demonstrați că limn-+oo Qn/n p(k)/k d) Demonstrați că (S,t>ip(&)/& )(Sm>i /m ) = - Sugestie Dacă seriale converg absolut, atunci (Y^ak/kL ( Y bm/mL = Y ( > a' bn/ l ' n>l >d\n ' ' [M ] Care este probabilitatea ca mcd(u, v) oo obținem valorile Cn = ±m + ( ) și Dmn - m + ( ) [M ] Continuând exercițiul anterior, arătați că dacă pentru unele constante a, / și £ (Nm)(Nn) m+n- Cmn = N(^(a + / )N + O(l)), (^ - n) n- Cn" = (tm)(t(" + / ^ + ( )) l ; nu se presupune că u > v ) [M ] Să presupunem că la pasul B u > v și să presupunem că raportul ѵ/u are o distribuție Brent mărginită G Care este probabilitatea ca data viitoare să fie efectuat pasul B u n • Sugestie Vezi ex - ► [YM ] (R P Brent (R P Brent) ) Găsiți Gi (x) - distribuția cantității min(u, v)/max(u, v) ca urmare a executării primului ciclu "scădere și deplasare" a algoritmului B conform ( ) Instruire Puneți Sn+i(x) = -fcGn( /( + kx)) și aplicați armonicii însumează transformarea Mellin [vezi R Flajolet, X Gourdon, R Dumas, Theor Comp sci ( ), - ] [HM ] Continuând exercițiul anterior, găsiți Ga(x) [HM/ ] Demonstrați sau infirmați relația lui Vallee ( ) [HM/ ] Este singura funcție G(x) care satisface ecuațiile ( ) și ( )? [M^b] Explorați "Algoritmul binar euclidian" al lui Harris, formulat după Programul B [NM^P] Demonstrați riguros că modelul lui Brent descrie comportamentul asimptotic al algoritmului B [M ] Pentru orice numere întregi nenegative m n > , considerăm un grafic direcționat cu vârfuri (m n) și arce de la vârfuri (m, n) la vârfuri (m!, n') pentru toate " scăderea și deplasarea" algoritmului B pentru a converti numerele întregi u și v având proprietățile [lg uj = m și [lg z] = n în numere întregi u' și v' având proprietățile [lg u'j = m' și [lg ѵ ' J = n Există, de asemenea, un vârf special "Stop" cu un arc care leagă vârfurile (n,n) și "Stop" pentru toate n > Determinați lungimea celei mai lungi secțiuni a drumului de la vârf ( m,n) până la vârful "Oprire" (Această valoare oferă o limită superioară a timpului maxim de execuție al algoritmului B ) ► [M ] Pentru m > n > , găsiți valorile u și u care au proprietățile [lg uj = m și [lg vj = n], astfel încât algoritmul B are m + l pași de scădere pentru a finaliza [M ] Demonstrați că numărul de scăderi la pasul B al algoritmului B nu va depăși niciodată + [lg max(u, v)J ► [M ] (R W Gosper ) Arătați cum să modificați algoritmul B pentru numere mari folosind o idee similară cu cea folosită în algoritmul L ► [M ] (VR Pratt) Extindeți algoritmul B la algoritmul Y, care este un analog al algoritmului X ► [M ] (R P Brent și H T Kung) - ѵ Să presupunem că și este ciudat; atunci numerele u și ѵ pot fi simultan fie pozitive, fie negative Ki [Setare inițială ] Atribuiți cu , înlocuiți și "-> ѵ și atribuiți c -c K [Pauză ] Atribuiți ui +- (u + v)/ Dacă w este par, atribuiți ѵ + - w, în caz contrar atribuiți ѵ + - u - ѵ și reveniți la pasul K | Demonstrați că pasul K este efectuat de cel mult + lg max(|u|, |v|) ori [M ] Folosiți algoritmul lui Euclid pentru a găsi o formulă simplă pentru gcd( m - , p - ), unde tipul este numere întregi nenegative [MP ] Calculați determinantul mcd(l, ) mcd(l, ) mcd(l,n) mcd( , ) mcd( , ) mcd( ,n) mcd(n, ) mcd(n, ) mcd(n, n) * Analiza algoritmului Euclid Timpul de execuție al algoritmului lui Euclid depinde de T, de numărul de pași de divizare A efectuati (vezi Algoritmul A și Programul A) Valoarea lui T este, de asemenea, un factor important care determină timpul de execuție al altor algoritmi, cum ar fi calculul funcțiilor care îndeplinesc legea reversibilității (vezi secțiunea ) Vom vedea în această secțiune că analiza matematică a lui T este interesantă și instructivă Legătura cu fracțiile continuate Algoritmul lui Euclid este strâns legat de fracțiile continuate (continuate), care pot fi exprimate ca = &i/(ai+& /(a +&z/(' •• Tspp-i+bp/ap) ••■) ) )• a + - ( ) LG ap- H - aplicația Există o frumoasă teorie a fracțiilor continuate, care face obiectul unui număr de cărți clasice, precum O Perron, Pie Lehre von den Kettenbruchen, ediția a III-a (Stuttgart: Teubner, ), volume; Khinchin A Ya Fracții continuate -M -L : GITTL, ; H S Wall, Teoria analitică a fracțiunilor continue (New York: Van Nostrand, ) Pentru o istorie timpurie a dezvoltării teoriei fracțiilor continue, a se vedea Claude Brezinski, History of Continued Fractions and Fade Approximants (Springer, ) Ne vom limita la o prezentare relativ succintă a acestei teorii, luând în considerare doar acele aspecte ale acesteia care sunt necesare pentru o înțelegere mai profundă a comportamentului algoritmului lui Euclid De interes primordial pentru noi vor fi doar acele fracții continue în care toți b din expresia ( ) sunt egali cu unu Pentru comoditatea notării, introducem notația //хі,Ж , ,Жп// = /(Жі + l/((r) + /(''' (^nl + /Ж") ))) ( ) Atunci, de exemplu, /M// = ț-, //*i,* // = - =-^- - ( ) Хі Хі + /Х Х Х + Dacă n = , simbolul Цхі, ,хпЦ este luat egal cu zero În plus, introducem așa-numitele continuante, sau K-polinoame Kn(xi, X , • ■ ■ , xn), în n variabile pentru n > , date de regulă { pentru n = ; Xi la n = ; ( ) XiKn-i(x , • ,xn) + Kn- (x , ,xn) pentru n > Astfel, / ( ) Acest lucru se poate dovedi prin inducție: întrucât din ( ) rezultă că Xq - //Хі, , ХпЦ - (tq, Xi , , xn^ / X^xi, , xn), //x ,a:i, ,xp// este reciproca laturii drepte a ultimei egalități Polinoamele X sunt simetrice în sensul că ■Kp((r) > R- ! • • • , Zhp) - Kp( Xp, • • • î x , Tj) ( ) Aceasta rezultă din proprietatea de mai sus observată de Euler și, ca urmare, avem ^n((r) , • • • *^n) = ((r) > • • • J D'P- ) " Kn - (^ • • • , *^P- ) ( ) pentru n > K-polinoamele satisfac de asemenea identitatea importantă / R-n+ ) - / (r)n) = (- )n, n > ( ) (Vezi exerciţiul ) Din această identitate şi egalitate ( ) rezultă că " și (- )"- //zhі, ,zhp//= - -+ , ChoChі Ch Ch ChіChz Chp- Chp unde qk = Kk(хі, ,хk) DESPRE) Deci, /f-polinoamele sunt strâns legate de fracțiile continue Orice număr real X din intervalul astfel încât Xn / punem Dp+ = L /XJ, Xn+ = /Xp - An+ ( ) Dacă Xn - , atunci mărimile An+i și Xn+i nu sunt definite și fracția continuă proprie pentru X este //Ai, , AnC Dacă Xn / , această definiție garantează că pentru care este definit Xn În special, dacă Xn = , atunci X = //Аі, ,АпЦ Dacă Xn / , atunci numărul X se află întotdeauna între CA\, ,AnC și //Ai, , An - //, deoarece conform ( ) cantitatea qn = Kn(Ai, ,An - Xn) crește monoton de la Kp(AiAp) la Kp(Ai, , An - ) pe măsură ce Xn crește de la la Conform egalității ( ), pe măsură ce qn crește, fracția continuă va crește sau descrește în funcție de faptul că numărul n este par sau impar Într-adevăr, datorită ( ), ( ), ( ) și ( ) |X - /Mі, , AnC\ = \//Ai, , An + XnC - //Ai, ,An//\ = \//Ar, , ,An, /Xn// -CAi, , An//\ kn(A , ,An, /Xn) Kn-i(A , ,An) Kp+i(Ai, ,An, /Xn) Kp(Ai, -,An) /(Kn(Ai, , ,An, /Xn)) /(/ ••• se numesc rapoarte parțiale ale numărului X Atenție la regularitatea comportamentului rapoartelor parțiale pentru numerele ^/ / , φ și e; motivele acestui tipar sunt discutate în ex și Pentru numerele \/ , r și nu se observă o regularitate vizibilă în comportamentul relațiilor parțiale Este interesant de observat că atunci când grecii antici au descoperit existența numerelor iraționale, ei au dat în esență prima definiție a numerelor reale în termeni de fracții continue infinite (Mai târziu au adoptat propunerea lui Eudoxus de a defini x = y în schimb după cum urmează: "x v > Procesul de expansiune într-o fracție continuă proprie începe cu Xo = X; notăm UQ = u, Vo = ѵ Presupunând că Xn = Vn/Un / , ecuația ( ) ia forma Ln+ = \un/Vn], Xn+ = Un/Vn - Ln+ = (Un mod Vn)/Vn ( ) Prin urmare, dacă acceptăm un+i = Vn, Vn+ = Un mod Vn, ( ) atunci condiția Хп = Vn/Un va fi îndeplinită pe parcursul întregului proces de expansiune a fracției Mai mult, relația ( ) este exact transformarea efectuată în algoritmul euclidian asupra variabilelor u și v (vezi Algoritmul A, pasul A ) De exemplu, deoarece = // , , , , //, se știe că aplicarea algoritmului euclidian numerelor u = și ѵ = va necesita exact cinci pași de divizare, iar la pasul A coeficientii [u/vj vor fi succesiv , , , si Daca Xn = si n > , atunci raportul partial An trebuie sa fie intotdeauna sau mai mult, deoarece Xn-\ este mai mic decat unu Această corespondență cu algoritmul lui Euclid înseamnă că fracția continuă proprie pentru numărul X se termină la un pas cu valoarea Xn = dacă și numai dacă X este un număr rațional, deoarece este evident că Xn nu poate fi egal cu zero dacă numărul X este irațional și, dimpotrivă, se știe că algoritmul lui Euclid se termină întotdeauna Dacă rapoartele parțiale obținute în timpul execuției algoritmului Euclid sunt egale cu Ai, Az, , An, atunci conform ( ) și Xn-i(A , ■ ■ ■, An) Ib) și Kn(Ai, Az, , An) Această formulă este valabilă și în cazul lui u , fie u și v numere întregi (u > v > ) astfel încât atunci când se aplică algoritmul euclidian la u și v, trebuie efectuate exact n pași de diviziune, iar numărul u este cel mai mic număr posibil care satisface aceste conditii Atunci u = Fn+ și ѵ = Fn+i Dovada Conform ( ), u = Kn(Ai, Az, ,An)d, unde Ai, A , ,AP și d sunt numere întregi pozitive și An > Deoarece Kp este polinom cu coeficienți nenegativi, incluzând toate variabilele, valoarea minimă este atinsă numai atunci când Аі = , , An-i = , An = , d = Înlocuind aceste valori în ( ), vom obține rezultatul dorit | Această teoremă a fost prima aplicație practică a șirului Fibonacci De atunci, numerele Fibonacci au găsit o aplicație largă în execuția și cercetarea algoritmilor Următorul rezultat a fost obţinut de T F de Lagny [Afem Acad sci Paris ( ), - ] El a compilat tabele cu primele câteva /C-polinoame și a descoperit că numerele Fibonacci dau cel mai mic numărător și numitor pentru fracțiile continue de o lungime dată Cu toate acestea, el nu s-a referit deloc la calculul celui mai mare divizor comun E Leger [Mat et Physique ( ), - ] La scurt timp după aceea, P J E Finck [IFaitd Elementaire d'Arithmetique (Strasbourg, ), ] a demonstrat printr-o altă metodă că dacă u > v > , atunci mcd( u, v) se calculează în cel mult ( lg v+ ) paşi, în timp ce G Lame [Comptes Rendus Acad sci Paris ( ), - ] a extins rezultatul la flogio(v + )] Un rezumat complet al acestor lucrări timpurii în analiza algoritmului a apărut în interesanta recenzie a lui J O Shallit Historia Mathematica ( ), - Cu toate acestea, o estimare mai precisă în cazul cel mai rău caz este o consecință directă a teoremei F Corolarul L Dacă și mod ѵ Prin urmare, conform teoremei F, numărul maxim de trepte n apare atunci când ѵ = Fn+i și umodv = Fn Deoarece Fn+ ( ) Fie Tn numărul mediu de pași de împărțire când ѵ = n, iar u este ales aleatoriu Deoarece după primul pas de împărțire, doar valoarea lui u mod v afectează progresul algoritmului, putem scrie mn = - £ T(k, n) ( ) ( ) n Această relație de recurență este ușor de rezolvat, având în vedere că Sn-jl - + - (So + Si -I- - Sn- + Sn) n+ n + + (n(Sn - ) + Sn) = Sn + Prin urmare, Sn este egal cu + | + • • • + = Hn - număr armonic Acum aproximarea Tp " Sn dă Tp și Ip p + ( ) Compararea acestei aproximări cu tabelele cu valorile adevărate ale lui Tp arată, totuși, că Ip p este prea mare (Tn nu crește la fel de repede ) Presupunerea că n este aleator modulo k este, din acest motiv, prea pesimistă Într-adevăr, o analiză mai atentă arată că valoarea medie a numărului n mod k este mai mică decât valoarea medie a numărului |A: pentru i = Pr(v(k+(r)) l = (Fn(l/fc) - Fn(l/(A: + x))) ( ) k>i Dacă distribuțiile Fo(x),Fi(x), definite prin aceste formule, converg către distribuția limită Fx>(x) = F(x), atunci obținem F(x) = ^(F(l/k)-F(l/(k + x))) ( ) L> (O relație similară, -( ), a fost obținută când s-au luat în considerare algoritmi binari pentru determinarea celui mai mare divizor comun ) Pentru orice bază b > , una dintre funcțiile care satisface ecuația ( ) are forma F(x) = Iog (l + x) (vezi exercițiul ) Din condiția suplimentară F(l) = rezultă că b = Astfel, ipoteza că F(x) = log(l + x) și că șirul Fn(x) converge către această limită este destul de justificată S-ar putea presupune, de exemplu, că F(|) = log(|) ~ , Să vedem cât de aproape este F"(|) de această valoare pentru n mic Avem Fq(|) = , și (tm)=E(|-*b)=I'; *> Fi(|) = H / = - p " , ; F (|) = H / ~ # / + # / ~ # / + # / - H / -I- (vezi Tabelul Anexa A) Generalizare la o serie de puteri Hx = deci funcția SG are și o derivată întâi mărginită (Diferențiarea termen cu termen a unei serii convergente este justificată atunci când seria derivată converge uniform; vezi, de exemplu, K Knopp, Theory and Application of Infinite Series (Glasgow: Blackie, ), § ) O expunere a dovezilor interesante ale lui Levy este dată în prima ediție a acestei cărți Fie H = SG și g(x) = ( + x)(?'(x), h(x) = ( + x)H'(x) Rezultă că Ce h(x) = fc>i +d / X- / \ (A + g) k + k + x) \k + x) = y( * ț-* \k + + x Cu alte cuvinte, h = Tg, unde T este un operator liniar astfel încât , h y g / k k - \/ \ w ~ k/r + + w k + x) \k + x)' K > (treizeci) Continuând, vedem că dacă funcția g are o derivată întâi mărginită, atunci ( ) poate fi diferențiată termen cu termen pentru a arăta că aceeași afirmație este adevărată pentru Tg: = - E (((r^ - q^) / k A: - \ , / \\ + \A + + x k + x) (k + x) \k + x)) (k + + x) (, (k + x) ^(fc + + x)) + f ,/ \\ (k + w) (A: + + x) \ A: + w / / ' În mod corespunzător, există un al treilea operator liniar [ ] astfel încât (Tg)' = -U(g'), adică mr , x k-'/ k fW+x) +x , J \ §Vfc + +a:) •A/(*+i+*) * t+ (k + mYk + I + x^Yk + x))' Au toate acestea vreo legătură cu problema de mai sus? Dacă TRĂI Гп(l) = lg(l + x) + ?n(lg(l + x)), ( ) /n(x) = ( + x) Wx) = ( + R'n (lg(l +*))), ( ) atunci primim /J) = R"( e( + x))/(( n ) ( + x)) ( ) Ca urmare a transformărilor efectuate dispare efectul influenţei termenului lg( -T) În plus, deoarece Fn = SnFo, obținem /n = Tnf și = (- ) "E " / o Prin inducție, ambele funcții Fn și /n au derivate mărginite Astfel, egalitatea ( ) ia forma (-l) "K" (lg (l + x)) \u d ( + x) ( n ) [ " / o (l) ( ) Atunci Fo(a:) = x, /o(x) = +(r), iar fâ(x) este o funcție constantă egală cu Să arătăm că operatorul Un transformă o funcție constantă într-o funcție care ia foarte mic valori, deci pentru , atunci Ucp(x) > Rezultă că operatorul U păstrează ordinea: dacă Pi(x) , și nu numai pe intervalul [ ], atunci putem elimina însumarea din ( ), observând că pentru o funcție continuă G, relația SG(x + ) - SG(x) = - lim S = ~ G( >- ( ) \ +W/ fe-+oo \k + X/ \ +Z/ Din faptul că T((l + x)C') = ( + x)(SG)' rezultă (vezi exercițiul ) Gr (g) Td ( + x) \u d \ / \ ( ) + x + x \ -x + x) \ - x)' Dacă presupunem că Tg(x) = /( + x), atunci aflăm că valoarea corespunzătoare a funcției g(x) este + x - /( + x) Punem cp(x) = g'(x) = + /( + x) , astfel încât Ucp(x) = -(Tp)'(x) = /( + x) Funcția cp și este funcția dorită Cu această alegere a funcției cp, obținem oc, distribuția Fn(x) este egală cu lg(l + x) + O( n) De fapt, Fn(x) - lg(l + x) se află între + n( n( + x)) (Іn /( + x)) pentru oo, ( ) unde c este o constantă și n = T(u, v) este numărul de iterații ale algoritmului Euclid atunci când se efectuează operații pe numere întregi u > v > O soluție completă a problemei Gauss a fost găsită câțiva ani mai târziu de K I Babenko [DAN SSSR ( ), - ], care a folosit puternicul aparat de analiză funcțională pentru a demonstra următoarea formulă: Fn(T) = lg(l + T) + A^>(T) ( ) >> pentru toți În această formulă |Ar| > |Az| > |A | > ••• fiecare dintre funcţiile FDz) este o funcţie analitică pe plan complex, cu excepţia [- su - ] Funcția Fg este funcția Wirsing F și Ar = -A, în timp ce Az " , , A " - , , A " , , A "- , , A " , Babenko a stabilit, de asemenea, proprietăți suplimentare ale valorilor proprii Aj, demonstrând, în special, că acestea sunt în scădere exponențial ca j -> oo și că suma lor din ( ) pentru j > k este limitată de valoarea (m / ) | A*|n- tip (t, - x) [Pentru mai multe informaţii, a se vedea Babenko şi Yur'ev, DAN SSSR ( ), - , Mayer şi Roepstorff, J Statistica] Physics ( ), - ; ( ), - ; D Hensley, J Number Theory ( ), - ; şi, de asemenea, în Daude, Flajolet şi Vallee, Combinatorics, Probability and Computing ( ), - ; Flajolet, Vallee, Comp Teoretic sci ( ), - ] John Hershberger a calculat valoarea de de cifre a lui A în ( ) De la continuu la discret Mai sus, am obținut rezultate legate de distribuția de probabilitate pentru fracțiile continuate în cazul în care X este un număr real distribuit uniform în intervalul [ ) Cu toate acestea, probabilitatea ca numerele reale să fie raționale este zero (aproape toate numerele sunt iraționale), astfel încât aceste rezultate nu se aplică direct algoritmului lui Euclid Înainte de a aplica teorema W pentru a rezolva problema, trebuie depășite unele dificultăți tehnice Luați în considerare următorul rezultat bazat pe teoria măsurii elementare Lema M Fie Zi, I , , , J , • • • să fie subintervale disjunse pe perechi, cuprinse în intervalul [ ), și fie Z=\Jh, /C = [ ]\(ZUj) fc>i *> Să presupunem că K are măsura zero Fie Pn să desemneze mulțimea { /n, /n, , (n - )/n} Apoi lim - ^-n~ = p(Z) ( ) n-> P Aici p(Z) este măsura Lebesgue a mulțimii I, adică lungimea(Zt-) și \TO Pn| denotă numărul de elemente ale mulţimii T G) Pn Dovada Fie - Uiocn A și Lv = Uki- , găsim ZV suficient de mare pentru a satisface relația p(In) -p(Lv) > - b și setăm KN = K, U [J P U |J L k>N k>N Este clar că dacă Z este oricare dintre intervalele (a b), [a b), (a b] și [a b], apoi p(r) = b - a și np(Z) - O În ex arată că lema M este netrivială în sensul că pentru validitatea formulei ( ) este necesar să se facă unele ipoteze destul de restrictive Distribuția relațiilor parțiale Combinând teorema W și lema M, demonstrăm acum câteva proprietăți fundamentale referitoare la algoritmul lui Euclid Teorema E Fie n și k numere întregi pozitive; fie pk(a,n) probabilitatea ca (k + )-al-lea coeficient A*,+ din algoritmul lui Euclid să fie egal cu a când ѵ = n și u este ales aleatoriu Apoi limpk(a,n) = Fk n->oo unde Fk(x) este funcția de distribuție ( ) Dovada Mulțimea I a tuturor X din [ ) pentru care A*+i = a este uniunea intervalelor disjunse, ca și mulțimea D a tuturor X pentru care Afc+ / a Prin urmare, lema M este aplicabilă, iar mulțimea K este mulțimea tuturor X pentru care Ak+i nu este definit Mai mult, Fk(l/a) - E*( /(a + )) este probabilitatea ca /(a + ) oo Dacă presupunem că egalitatea aproximativă ( ) este satisfăcută, atunci următoarea formulă: ( ) primim p P ~ G + , , ( ) unde A(d) este funcția von Mangoldt definită de reguli și flnp' A("> = Io dacă n = pT, unde p este un număr prim și r > ; in caz contrar ( ) (Vezi exercițiul ) De exemplu, m p / pp p p p p \ , * -O" - - - T - V - ) + " ( , ) ( , - , - , - , - , ) + , " , ; valoarea exactă a lui Chuo este , De asemenea, se poate estima numărul mediu de trepte de împărțire în cazul în care ambele numere u și v sunt distribuite uniform între și N prin calcul Presupunând valabilitatea formulei ( ) în exercițiu arată că această sumă are forma l^lnN + O(l), ( ) TZ iar calculele empirice efectuate cu aceleași numere care au fost folosite la derivarea relației -( ) sunt în acord cu formula ^■^lnW + , ( ) G* Desigur, până acum nu am demonstrat nimic despre comportamentul lui Tn și mn în cazul general Până acum, au fost luate în considerare doar posibilele circumstanțe în care anumite formule trebuie să fie adevărate Din fericire, acum este posibil să se aplice tehnica demonstrației riguroase, care se bazează pe o analiză atentă efectuată de o serie de matematicieni Pentru prima dată, termenul principal ( n )/m din formulele de mai sus a fost obținut independent de John D Dixon și Hans A Heilbronn Dixon [J Number Theory ( ), - ] a dezvoltat teoria distribuției Fn(x) pentru a arăta că rapoartele parțiale individuale sunt într-un anumit sens independente unele de altele și a demonstrat că pentru orice e pozitiv, |T(m, n )- (( p )/tg ) pp| O abordare absolut diferită a acestei probleme, în care sunt considerate numai numere întregi în loc de variabile continue, a fost propusă de Heilbronn Baza ideii sale, prezentată într-o formă ușor modificată în exercițiu și , adevărul este că mn poate fi legat într-un fel de numărul de moduri în care poate fi reprezentat n În plus, a lui Number Theory and Analysis, editată de Paul Turân (New York: Plenum, ), - , arată că distribuția rapoartelor parțiale individuale , , , care a fost considerată mai sus, este de fapt aplicabilă întregului set de rapoarte parțiale aparținând fracțiilor cu un numitor dat Aceasta este o formă mai precisă a Teoremei E Câțiva ani mai târziu, JW Porter [Mathematika ( ), - ] a obținut un rezultat și mai precis El a stabilit că mn = ^ n + C + O(n- / + £), ( ) unde C yav , este o constantă ( p + - tg- C'( ) - ) - ( ) vezi D E Knuth, Computers and Math cu Applic ( ), - Astfel, afirmația ( ) este complet dovedită Folosind formula ( ), Graham X Norton (Graham H Norton) [J Symbolic Computation ( ), - ] a continuat calculele ex pentru a demonstra că constanta empirică , din formula ( ) este de fapt egală cu ( Ip + - m" C'( ) - ) - " , ( ) G E Collins, folosind algoritmi clasici pentru efectuarea de operații aritmetice, a arătat în SICOMP ( ), - că timpul mediu de execuție al algoritmului euclidian atunci când se operează cu numere de precizie multiple este ( + log(max(iz, n)/gcd(iz, u))) logmin(iz, v) ( ) Rezumat Am constatat că cel mai rău caz al algoritmului lui Euclid apare atunci când numerele de intrare u și ѵ sunt legate de numerele Fibonacci (Teorema F), iar numărul de pași de împărțire pentru pentru tot j [M Demonstrați că expansiunea unui număr într-o fracție continuă proprie este unică în următorul sens Dacă Ві, В , • • ■ sunt numere întregi pozitive, atunci fracția continuă infinită //Ві, В , - • • // este un număr irațional X situat între și , a cărui expansiune într-o fracție continuă proprie are elementele An = Bn pentru toate n > Dacă Bi, , W sunt numere întregi pozitive și W > , atunci fracția continuă proprie pentru numărul X = //Bi, , W// are elementele An = Bp pentru ; c) //хі, ;xk-i,xk,Q,xk+i,xk+ , - ,хп// = Цхі, ,,xk-i,xk + И+іЛ+ r,- ■ -,xn//, [M ] Din rezultatul ex rezultă că orice număr irațional X este unic descompunebil într-o fracție continuă proprie a formei x = a + //a ,a ,a , //, unde Ao este un număr întreg și Ai, Ag, Az, sunt numere întregi pozitive Arătați că dacă X are o astfel de reprezentare, atunci expansiunea lui /A' într-o fracție continuă proprie are forma / X \u d Bo + //Bi, , W, A , A , C pentru numerele întregi corespunzătoare Bo, Bi, [MZO] (J -A Serret (J -A Serret), ) Fie X = Ao + //Ai, Ag, Az, A , // și Y = Bo + / /Ві, Вг, Вз, В , ■ // - reprezentări sub formă de fracții regulate continuate a două ■numere reale X și Y în sensul ex Arătați că aceste reprezentări sunt "eventual consistente" în sensul că Am+*, = Bn+k pentru unele m și n și pentru toate k > dacă și numai dacă pentru unele numere întregi q, r, s t, X - ( qY -\-r)/(sY+t) este satisfăcută pentru \qt - rs| = (Această teoremă este analogă cu reprezentarea fracțională continuă a rezultatului simplu că reprezentările zecimale ale numerelor întregi X și Y coincid în cele din urmă dacă și numai dacă pentru unele numere întregi q, r și s X = ( chU -I-r)/ s ) ► [MZO] O iraționalitate pătratică este un număr de forma (y/D - U)/V, unde D, U și V sunt numere întregi care îndeplinesc condițiile D > , V / și D nu este un perfect pătrat Fără pierderea generalității, putem presupune că V este un divizor al numărului D - U , altfel acest număr poate fi rescris sub forma (y/DV - H|V|)/(V|V|) a) Demonstrați că expansiunea continuă a fracției (în sensul exercițiului ) a iraționalității pătratice X = (\/D - U)/V se obține prin următoarele formule: Vo = V, Ao = |XJ, Uo = U + A V; Yn+i - (D - U )/Vn, An+i = [(r/P-I-[ n)/Vn+iJ, Un+i - An+iVn+i - Un b) Demonstrați că pentru tot n > N, unde N este un număr întreg în funcție de X, inegalitățile /D, să fie un polinom cu coeficienți întregi care nu are rădăcini raționale și are exact o rădăcină reală t > Dezvoltați un program de calculator pentru a găsi aproximativ primele mii de rapoarte parțiale de £ utilizând următorul algoritm (care implică doar adăugare) L Atribuiți A (Aceasta este notația general acceptată pentru fracția continuă infinită // , n - , , , n - , , , n - , , // ) Găsiți și fracția continuă extinderea numărului e" /,n, unde n > este impar ► [AG ] (a) Demonstrați că //хі, - xr// = Цхі - , ,хг - //- (b) Generalizați această identitate obținând formula FOR //(r) , - X , Xs, - X , X , - Xb, • ■ • , X n- , - X pC, ÎN CARE rapoartele parțiale BCv sunt numere întregi pozitive, cu condiția ca toți x să fie numere întregi pozitive mari, (c) Din rezultatul ex rezultă că tanl = // , - , , - , // Aflați expansiunea lui tan într-o fracție continuă proprie [M ] Arătați că //ai, az, , at, xi, ai, az, , at, xr, ai, ar, , at, xs, / / - Ts-m, , az, ai, xi, at, • • •, ar, ai, xr, at, , ar, ai, xs, // nu depinde de xi, xg, xs, Indicație Înmulțiți ambele fracții continue cu Km(ai, ag, ■ ■ ■, at) [M ] Demonstrați că F(x) = logb( + x) satisface ecuația ( ) [HM ] Derivați ( ) din ( ) [HM ] (E Wirsing) S-au obţinut restricţii ( ) pentru funcţia , oferă cele mai bune estimări (K I Babenko ) Elaborați o metodă eficientă pentru calcularea aproximărilor exacte pentru mărimile Aj și ^(x) din ( ) pentru ;> u Deci, de exemplu, dacă u = și v = , atunci mcd( , ) = mcd(- , ) = mcd( , ); când multiplii lui sunt scăzuți din , cel mai mic rest absolut este - Comparați această procedură cu algoritmul lui Euclid; Estimați numărul de pași de divizare salvati ca rezultat al aplicării acestei metode ► [MS ] Găsiți cel mai rău caz pentru algoritmul euclidian modificat propus în Ex Care sunt cele mai mici numere inițiale și > v > , pentru prelucrarea cărora este necesar să se cheltuiască n trepte de împărțire? [ ] (a) Un cuvânt cu lungimea n în codul Morse este un lanț de r puncte și s liniuțe astfel încât r + = n De exemplu, cuvintele cu lungimea în codul Morse sunt ' > * " •) ■"'" ' ' > • Având în vedere că Ka(xi, x , xs, xa) este un polinom egal cu + xix? + X X + : X + , găsiți și demonstrați o legătură simplă între polinomul Kn(xi, ,xn) și cuvintele de lungime n în codul Morse (b) (L Euler, Novi Com Acad Sci Pet ( ), - ) Demonstrați că Km + p (xi, , Xm -n) = Kgg ( Xi, , Xm)Kn (^m -l , • • • , Xm+n ) + (з*!, • • * j Xm - i )Kn- (Xm - , • • ■ , ?m+n) • [M ] Fie h(n) numărul de reprezentări diferite ale lui n în formă n = xx' + yy', x > y > , x' > y' > , x±y, unde x, x', y, y' sunt numere întregi a) Să se arate că dacă aceste condiții sunt relaxate pentru a permite x' = y', atunci numărul de reprezentări posibile ale lui n este h(n) + [(n - )/ J b) Să se arate că pentru fix y>OnO , xm+k > și d este un divizor al lui n Acum din identitatea dată în exercițiu , rezultă că n/d = Km+k(xL, , Xm+k) - Dimpotrivă, orice succesiune dată de numere întregi ? , , Xm+k, astfel încât Xi > , Xm+k > , ȘI PENTRU care Km+k(x , P e) Să se arate că nTn = [( n - )/ j + h(n) [НМ ] (G Heilbronn (N Heilbronn) ) Fie hd(n) numărul de reprezentări ale numărului n descris în exercițiu pentru care xd egalitatea /gDn) = J (n/(j/(j/ + t))) + O(n) este satisfăcută, unde suma este preluată peste toate numerele întregi y şi t, pentru care t±j/nO n > [M ap(nj > аР( ) > "P(ni) > • • ■, iar minimul va fi la ap( ) log^(\/ n + ) - ► [M ] (R W Gosper ) Numărul mediu de lovituri pe care le aruncă un jucător de baseball este Care este numărul minim posibil de lovituri pe care le execută? [Reamintim cititorilor non-baseball că media de lovire = (număr de aruncări)/(număr de bâte) rotunjită la trei zecimale ] ► [M ] (Arborele Stern-Brocot) Să considerăm un arbore binar infinit în care fiecare nod este asociat cu o fracție (pi + Pr)/(qi + qr), unde pi/qi este eticheta nodului, cel mai apropiat de predecesorul din stânga, npr/qr este eticheta nodului cel mai apropiat de predecesorul din dreapta (Predecesorul din stânga este în fața nodului în ordine simetrică, în timp ce predecesorul din dreapta este în spatele nodului Consultați secțiunea pentru o definiție a ordinii simetrice ) Dacă nu există predecesori din stânga pentru un nod, atunci pi/qi este / ; în absenţa precursorilor drepti pT/y = / Astfel, eticheta nodului rădăcină este / ; etichetele nodurilor generate de nodul rădăcină vor fi / și / ; etichetele celor patru noduri ale celui de-al doilea nivel de la stânga la dreapta vor fi / , / , / și / ; etichetele celor opt noduri ale celui de-al treilea nivel vor fi / , / , / , / , / , / , / , / și așa mai departe Demonstrați că pentru fiecare etichetă p/q numărul p este relativ prim cu q; în plus, nodurile cu etichetele p/q preced nodurile cu etichetele p'/q/ în ordine simetrică dacă și numai dacă etichetele satisfac inegalitatea p/q r + î + ?+"'~^ "- n > conține doar unu și doi și este prezentat într-o formă extrem de simplă Demonstrați că, în cazul în care I este orice număr întreg > , rapoartele parțiale ale numerelor Liouville n>i^ n! au un aspect regulat [Aceste numere, introduse de J Liouville în J de Math Pures et Appl ( ), - , au fost mai întâi strict definite ca transcendentale Primul care a demonstrat transcendența acestei forme de număr și a constantelor similare a fost O J Kempner (A J Kempner) în Trans amer Matematică soc ( ), - ] [M ] (J Lagrange, ) ) Se notează cu ||x|| distanța de la x la cel mai apropiat număr întreg minp |x - p| Arată că ||qX|| > ||qn-i A'|| pentru este nereprezentabil, poate fi introdus în următorul mod simplu Fie expansiunea numărului x într-o fracție continuă proprie să aibă forma ao + //ai, az, // și fie pn = Kn+i(ao, ap) Atunci rotund(r) = (pt/qi), unde fracția (pi/q,) este reprezentabilă, dar fracția (pi+i/qi+i) nu este [Indicaţie Vezi ex ] [M [ Să presupunem că se realizează aritmetica cu bare fixe cu rotunjire mediană în care fracțiile (și/și ) sunt reprezentabile dacă și numai dacă |și| oo, necesită O(n ) unități de timp pentru a se finaliza (Aceeași limită superioară este valabilă și pentru execuția algoritmului B ) [MJ ] Este posibil să se reducă limita superioară a O(n ) în ex dacă se folosește un alt algoritm pentru a calcula cel mai mare divizor comun? [MJ ] Dezvoltați un program de calculator pentru a găsi cât mai multe rapoarte parțiale pentru un număr real x de mare precizie Folosiți-l pentru a calcula primele câteva mii de rapoarte parțiale pentru constanta lui Euler , care pot fi calculate folosind algoritmul descris de DW Sweeney în Math Comp ( ), - (Dacă y are un număr rațional, atunci puteți găsi numărătorul și numitorul acestei constante, rezolvând astfel celebra problemă matematică Conform teoriei prezentate în secțiune, dacă considerați numărul original ca fiind aleatoriu, ar trebui să vă așteptați să primiți aproximativ , rapoarte parțiale pentru fiecare zecimală Cu (vezi algoritmul L și JW Wrench și D Shanks, Math Comp ( ), - ) [M ] Fie To = ( , , u), Ti = ( , , u), , Tn+ = ((-l)n+ e/d, (-l)nu /d, ) reprezintă secvențe de vectori calculate prin algoritmul X (algoritmul lui Euclid extins) și fie //ai, ,apC o fracție continuă proprie pentru ѵ/u Exprimați Tj în termeni de continuanți incluzând ai, , an, unde a > , găsiți numere întregi x și y astfel încât ax = y (modulo m), o;±î/, , atunci poate fi împărțit la numere prime succesive p = , , , până când se găsește cel mai mic număr p pentru care n mod p - Atunci p va fi cel mai mic factor prim al n Același proces poate fi aplicat la n p Dar din condiția pi > p rezultă că p > {p + I) > p(p + ) > p + (nmodp) > [n/pjp + (n modp) = n Ca rezultat, obținem următoarea procedură Orez Un algoritm simplu de factorizare Algoritmul A (Descompunerea în factori primi prin diviziune) Având un număr întreg pozitiv N, acest algoritm (Fig ) găsește factorii primi рі y/N Al [Setare inițială ] Atribuiți t dk, creșteți k cu și reveniți la pasul A [n este un număr prim ] Creșteți t cu , atribuiți pt , excluzând astfel toate numerele care sunt multiple de cinci ca numere prime false, atunci putem economisi până la % din timpul de execuție al algoritmului Excluzând multiplii lui din considerare, lista poate fi redusă cu încă % și așa mai departe Pentru a controla alegerea divizorilor de probă, puteți utiliza un tabel compact Dacă se știe că N este mic, este logic să aveți un tabel cu toate numerele prime necesare ca parte a programului De exemplu, dacă N este mai mic de un milion, atunci trebuie incluse de numere prime mai mici de (di = trebuie adăugată la această listă ca termen final pentru cazul în care N se dovedește a fi un prim mai mare de ) Un astfel de tabel poate fi obținut folosind un program auxiliar scurt (vezi, de exemplu, algoritmul P sau exercițiul ) Câți divizori de încercare sunt necesari pentru algoritmul A? Fie m(a:) numărul de numere prime mr(a:) = £ + (a;e-lv^) ( ) [Întâlnit Couronnes Acad Roy Belgique ( ), - ; vezi şi J Hadamard, Buh soc Matematică France ( ), - ] Integrarea pe părţi dă xx ! xr\xfx P X Inx + (In a:) (In a:) (lna:)r+ \(loga:)r+ pentru toți r fix > Ulterior, termenul rămas din formula ( ) a fost rafinat succesiv De exemplu, poate fi înlocuită cu următoarea expresie: O(a:exp(-A(loga:) '/ /(logloga:) '/ )) [Cm A Walfisz, Weyl'sche Exponentialsummen in der neueren Zahlentheorie (Berlin, ), capitolul ] În , Bernhard Riemann a sugerat că *(*) = £ + ( ) = L(x) - |f(^) - + ■ • + ( ), ( ) unde L(x) = f? dt/\nt Această formulă este în acord cu calculele efectuate atunci când alegeți x într-un interval adecvat X r(a:) L(a:) Formula Riemann IO , , IO IO IO IO IO (Vezi exercițiul ) Cu toate acestea, problema distribuției numerelor prime nu este atât de simplă, iar în J E Littlewood a arătat că există o constantă pozitivă C astfel încât inegalitatea r(a:) > L(x) + Ci/Jlogloglogx/loga: este adevărată pentru infinitate valori ale lui x, care a respins ipoteza lui Riemann ( ) (Vezi Hardy, Littlewood, Acta Math ( ), - ) Rezultatul lui Littlewood a arătat că există ceva mistic în legătură cu numerele prime și că trebuie dezvoltată o teorie matematică profundă pentru a înțelege cu adevărat legile distribuției lor Riemann a făcut o sugestie mult mai constructivă, cunoscută sub numele de "ipoteza Riemann", conform căreia funcția complexă £(z) dispare doar atunci când partea sa reală este egală cu / , cu excepția cazurilor triviale când z este un număr întreg negativ Dacă această presupunere este adevărată, atunci rezultă din ea că r(іr) = L(x) + O(y/xlogx); vezi ex Richard Brent a efectuat un test numeric al ipotezei Riemann pentru toate valorile "mici" ale lui z folosind metoda lui D H Lehmer și a arătat că funcția C(z), a cărei parte imaginară aparține intervalului cu, unde F poate fi calculată ca rezultat al rezolvării ecuației funcționale E(o) = pentru a > ( ) Raționamentul lui a mers cam așa Pentru un n/x este - F(|) = n , care este de aproximativ % În toate aceste cazuri, execuția algoritmului A este asociată cu anumite dificultăți Să discutăm acum întrebarea cât de repede algoritmul A va produce un rezultat în cazul în care multiplicatorul este limitat la un număr de șase cifre Rețineți că pentru numere mari N, dacă avem ghinion, timpul total pentru finalizarea procedurii de factorizare folosind factori de încercare va depăși foarte repede capacitățile practice ale algoritmului Se va arăta mai târziu în această secțiune că există modalități destul de bune de a determina dacă un n relativ mare este un număr prim fără a verifica toți divizorii de probă până la y/n Prin urmare, algoritmul A va rula mai rapid dacă între pașii A și A includem o verificare că un număr aparține numerelor prime Pentru un algoritm îmbunătățit în acest fel, timpul de execuție poate fi considerat ca o primă aproximare proporțională cu pt-i, adică al doilea cel mai mare factor prim al lui N în loc de max(pt i, y/pt) Folosind argumente similare cu cele ale lui Dieckmann (vezi Exercițiul ), se poate demonstra că, cu o probabilitate aproximativă | această funcție G(J ) = (vezi Fig ) Rezolvarea numerică a ecuațiilor ( ) și ( ) oferă următoarele "procente de valori" ale acestor funcții F(a),G(/?) = a= / = Astfel, aproximativ jumătate din timp, al doilea cel mai mare factor prim va fi oo tinde să -U Г e~u / du ( ) pentru orice s fix Cu alte cuvinte, distribuția lui t este în esență normală cu media și varianța egale cu n n x\ pentru aproximativ , % din toate numerele mari = , + ( ) [Cm G H Hardy, E M Wright, An Introduction to the Theory of Numbers, ediția a -a (Oxford, ), § ; vezi şi P Erdos, M Kac, Amer J Math ( ), - ] Mărimea factorilor primi are o relație remarcabilă cu permutările Numărul mediu de biți din cel de-al-lea cel mai mare factor prim al unui număr de n-biți aleatoriu - ca n -> su tinde asimptotic la lungimea medie a celui de-al-lea cel mai mare ciclu de permutări ale unui n-element aleatoriu [Cm D E Knuth și L Trabb Pardo, Comp teoretic sci ( ), - ; AM Vershik, Matematica sovietică Doklady ( ), - ] Rezultă că algoritmul A găsește mai întâi câțiva factori mici și apoi începe o căutare lungă pentru restul factorilor mai mari Pentru o descriere excelentă a distribuției de probabilitate a factorilor primi pentru numerele întregi aleatorii, a se vedea lucrarea lui Patrick Billingsley în AMM ( ), - (vezi și lucrarea sa în Annals of Probability ( ), - ) Factorizarea primilor folosind cicluri pseudoaleatoare La începutul capitolului , sa subliniat că generatorul de numere aleatoare ales produce numere care nu sunt complet aleatorii Această teză, care a lucrat împotriva noastră în acel capitol, se dovedește a fi o binefacere aici și conduce la metoda uimitor de eficientă de factorizare descoperită de J M Pollard [BIT ( ), - ] Numărul de pași de calcul în metoda Pollard este de ordinul lui y/pt-i, deci pentru N mare este mult mai rapid decât Algoritmul A După cum rezultă din ecuația ( ) și Fig , timpul de execuție al algoritmului care implementează metoda Pollard este de obicei mai mic de V / Fie f(n) un polinom cu coeficienți întregi Luați în considerare două secvențe x =y =A; xm+ = f(xm) mod N, ym+i = Nm) modp, ( ) unde p este orice factor prim al lui N Atunci ym=xmmodp pentru m > ( ) De la ex - se poate observa că pentru unele m > este valabilă egalitatea ym = utm)-i, unde (m) este cea mai mare putere a lui care nu depășește m Astfel, diferența xm - W(m)-i va fi multiplu al p Mai mult, dacă f(y)modp se comportă ca o mapare aleatorie a mulțimii { , , , p- } pe sine, atunci, așa cum se arată în ex - , valoarea medie a celui mai mic dintre acești m va fi de ordinul lui y/r De fapt, această valoare medie pentru eșantioanele aleatoare este mai mică de , Q(p), așa cum se arată în exercițiu de mai jos; funcția Q(p) la y/ppi a fost definită în Secțiunea Dacă diferiți divizori primi ai lui N corespund unor valori diferite ale lui m (ceea ce este aproape întotdeauna adevărat pentru N mare), aceștia pot fi găsiți calculând mcd(zm - xi(m) i, N) pentru m - , , , până când restul după împărțirea la un factor devine simplu Pollard a numit această metodă metoda rho, deoarece succesiunea periodică a formei yo > yi > • • • seamănă cu litera greacă p Din capitolul se știe că polinomul liniar f(x) = ax+c nu oferă suficientă aleatorie a șirului Următorul cel mai simplu tip de polinom este polinomul pătratic f(x) = x + Nu știm dacă această funcție oferă aleatorie, dar lipsa de cunoștințe în această problemă ne înclină, cel mai probabil, în favoarea ipotezei că funcția oferă suficientă aleatorie, iar testele empirice au arătat că se comportă conform așteptărilor De fapt, funcția / probabil chiar dă puțin mai mult decât aleatoriu, deoarece x + conține doar | (p + ) valori distincte modulul p (vezi Arney, Bender, Pacific J Math ( ) , - ) În legătură cu cele spuse, este potrivită următoarea procedură Algoritmul B (Descompunerea în factori primi folosind metoda rho) Acest algoritm calculează factorii primi ai unui număr întreg dat N > cu mare probabilitate, deși este posibil și un rezultat negativ (adică factorul nu va fi găsit - Aproximativ, transl ) ÎN [Setare inițială ] Atribuiți x - , x' - , k , atunci reveniți la pasul C , altfel reveniți la pasul C eu Poate că cititorul va găsi interesant să caute manual factorii primi ai numărului folosind acest algoritm Numărul de pași necesari pentru a găsi factorii u și ѵ ai numărului N = uѵ este în esență proporțional cu (x + y - )/ - L^NJ = v - [x/NJ; aceasta, desigur, poate fi foarte mare, deși fiecare pas poate fi efectuat foarte rapid pe majoritatea computerelor R Sh Leman (RS Lehman) [Mat Comp ( ), - ] a îmbunătățit algoritmul în așa fel încât în cel mai rău caz necesită doar operații O(n/ ) Apelarea algoritmului C Metoda lui Fermat nu este complet corectă, deoarece abordarea lui Fermat este oarecum mai simplificată Pe computere, bucla principală a algoritmului C este destul de rapidă, dar este de puțin folos pentru calculele manuale De fapt, Fermat nu a salvat valorile curente ale lui y, a luat în considerare valoarea lui x - N și, pe baza celor mai puțin semnificativi biți, a concluzionat dacă această valoare este un pătrat perfect (Ultimele două cifre ale unui pătrat întreg trebuie să fie , el, e , , o sau e , unde e este o cifră pară și o este o cifră impară ) Din acest motiv, a evitat operațiile care au fost efectuate în pașii C și C , înlocuindu-le cu folosirea unor tehnici speciale prin operația de determinare a unui număr care nu este un pătrat perfect Modul Fermat de a vizualiza cifrele cele mai din dreapta poate fi, desigur, generalizat folosind alte module Pentru claritate, presupuneți că N = (semnificația istorică a acestui număr este descrisă mai jos) și luați în considerare următorul tabel m Dacă x mod m este egal cu , atunci x mod m este egal cu și (x - N) mod m este egal cu , , , , , , , , , , Dacă x - N este pătratul perfect al lui y , atunci trebuie să aibă un rest modulo m corespunzător acestui fapt De exemplu, dacă N = și x mod / , atunci (x - N) mod = , adică x - N nu poate fi un pătrat perfect Prin urmare, x trebuie să fie un multiplu de pentru toate valorile lui N = x - y Din tabel se vede că x mod = ; x mod = , sau ; x mod = , , sau ; ( ) x mod = sau (deci x mod = ); x mod = , , , , sau Acest lucru scurtează foarte mult procesul de găsire a lui x Să fie, de exemplu, x trebuie să fie un multiplu al lui Atunci x > [\/LP = și cel mai mic multiplu al lui este Această valoare are un rest de ( , , ) modulo ( , , ), respectiv, deci nu satisface ecuația ( ) față de modulo Prin creșterea x cu , se poate înlocui restul modulo cu , modulo cu și modulo cu Prin urmare, este ușor de observat că prima valoare a lui x > care îndeplinește toate condițiile din ecuația ( ) este x = Acum - N = și calculând manual rădăcina pătrată, obținem că = este într-adevăr perfect pătrat Astfel, se obține soluția dorită x = , y = , iar descompunerea în simplă factorii are forma \u d (x - y) (x + y) \u d * Această valoare a lui N este interesantă deoarece economistul și logicianul englez W S Jevons (WS Jevons) într-o carte binecunoscută, a fost introdusă după cum urmează: pentru un număr mare, trebuie să-i găsiți factorii Puteți spune care două numere au fost înmulțite pentru a face ? Nu cred că nimeni în afară de mine știe asta " [Principiile științei (Macmillan, ), capitolul ] Cu toate acestea, după cum reiese din cele de mai sus, Fermat a fost capabil să factorizeze acest număr în factori primi pe spatele unui plic în mai puțin de zece minute! Ideea de bază a lui Jevons despre complexitatea factorizării numerelor în factori primi în comparație cu înmulțirea lor este valabilă, dar numai atunci când avem de-a face cu un produs de numere care nu sunt atât de apropiate unele de altele În locul modulelor considerate în ecuația ( ), pot fi folosite orice puteri ale diferitelor numere prime De exemplu, dacă luăm în loc de , atunci valorile posibile pentru x mod sunt , , , , , și Acest lucru oferă mai multe informații decât ( ) În general, puteți obține mai multe informații modulo p decât modulo p pentru p impar, dacă x - N = (modulo p) are o soluție x Metoda modulară considerată se numește metoda de sită (procedura de sită), deoarece se poate imagina că toate numerele întregi trec prin "sită", trecând numai acele valori pentru care x mod = ; apoi aceste numere sunt cernute printr-o altă sită care trece doar numerele pentru care x mod = , sau , și așa mai departe Fiecare sită cerne individual aproximativ jumătate din valorile rămase (vezi exercițiul ) Când cernerea se realizează folosind module coprime în perechi, apoi pe baza teoremei chineze a restului (Teorema C), fiecare sită funcționează independent de celelalte Prin urmare, dacă s-ar verifica, să zicem, de numere prime diferite, atunci pentru a determina dacă x - N ar fi un pătrat perfect pentru y , ar fi suficient să testăm doar unul din de numere prime Algoritmul D (Descompunerea în factori primi prin metoda sită) Având în vedere numerele impare N, acest algoritm determină cel mai mare factor al lui N care este mai mic sau egal cu VN Procedura utilizează module coprime perechi mi, m , , mr, care sunt, de asemenea, coprime pentru N Să presupunem că sunt disponibile r tabele de screening [r, j], în comparație cu algoritmul C (exercițiul ) Procedurile de cernere pot fi aplicate la o varietate de alte sarcini, care nu sunt neapărat legate de efectuarea operațiilor aritmetice O trecere în revistă a acestor metode este de Marvin C Wunderlich și este dată în JACM ( ), - În secolul al XIX-lea, pentru factorizarea numerelor în factori primi, FW Lawrence a propus proiectarea unor mașini speciale de cerne [Quart J de matematică pură şi aplicată ( ), - ], iar în , E O Carissan (E O Carissan) a completat un astfel de dispozitiv cu încă module [Pentru o poveste interesantă a modului în care sitele de mult uitate din Carisan au fost redescoperite și păstrate pentru posteritate, vezi Shallit, Williams, Morain, Math Intelligencer , ( ), - ] Multe mașini de screening diferite au fost dezvoltate și utilizate în anii - de către D G Lehmer și asociații săi, care au început cu lanțuri de biciclete și mai târziu au folosit celule fotoelectrice și alte tehnologii (vezi , de exemplu, AMM ( ), - ) Sita electronică a lui Lehmer folosind o linie de întârziere, care a fost pusă în funcțiune în , procesează un milion de numere pe secundă Până în , a fost posibil să se construiască o mașină care a verificat milioane de numere pe secundă, efectuând de iterații la pașii D și D în aproape , ns [Cm Lukes, Patterson, Williams, Nieuw Archief voor Wiskunde ( ) ( ), - ] D H Lehmer și Emma Lehmer descrise în Math Comp ( ), - , o altă metodă de factorizare prime folosind o sită Verificarea dacă numerele sunt prime Dintre toți algoritmii luați în considerare până acum, niciunul nu poate determina efectiv dacă un număr mare n este prim Din fericire, există și alte modalități de a rezolva această problemă Metode eficiente au fost dezvoltate de E Lucas (E Lucas) și alții, în special, D G Lehmer [vezi Taur amer Matematică soc ( ), - ] Conform teoremei lui Fermat (Teorema F) xp~x modp = , când p este prim și x nu este un multiplu al lui p Cu toate acestea, există metode eficiente pentru calcularea m" mod n care necesită numai înmulțiri O(logn) modulo n (Aceste vor fi explorate în Secțiunea ) Prin urmare, se poate determina adesea că n nu este prim, asigurându-vă că că nu este îndeplinită condiția dată De exemplu, Fermat a stabilit odată că numerele + , + , + , + și + sunt prime Într-o scrisoare către Mersenne, scrisă în , Fermat a sugerat că + este întotdeauna un număr prim și a raportat că nu a putut determina dacă = + este prim Nici Ferma, nici Mersenne nu a rezolvat vreodată această problemă, deși ar fi putut să o facă în felul următor: se poate calcula numărul mod ( + ) prin efectuarea a de operații de pătrare modulo + și obținerea rezultatului egal cu ; prin urmare (prin o teoremă descoperită de Fermat în același !) + nu este un număr prim Acest argument nu dă nicio idee despre care sunt factorii, dar este răspunsul la întrebarea lui Fermat Teorema lui Fermat este un instrument de analiză puternic care face posibilă determinarea faptului că un anumit număr nu este prim Dacă numărul n nu este prim, atunci este întotdeauna posibil să se găsească o valoare a lui x < n astfel încât i"- mod n φ Experiența arată că o astfel de valoare este aproape întotdeauna găsită foarte repede Există mai multe valori rare ale numărului m, pentru care a:"- mod n este adesea egal cu unu, dar apoi n are un factor mai mic (Ex ) Această metodă poate fi extinsă pentru a demonstra că un număr mare n este într-adevăr prim folosind următoarea idee Dacă există un număr x pentru care ordinea lui x modulo n este n - , atunci n este prim (Ordinea unui număr x modulo n este 